Data Science (Veri Bilimi)
Bireysel sayfadasınız. Kurumsal sayfaya geçebilirsiniz.
Renkler tuhaf mı görünüyor? Samsung Internet tarayıcısı koyu modda site renklerini değiştiriyor olabilir. Kapatmak için Internet menüsünden Ayarlar → Kullanışlı Özellikler → Labs → Web site koyu temasını kullan seçeneğini etkinleştirebilirsiniz.
Bireysel sayfadasınız. Kurumsal sayfaya geçebilirsiniz.
Hızlandırılmış programların ders süresi daha azdır ancak öğrencinin kendi vaktinde daha fazla çalışmasını gerektirir.
Günümüzün dijital ekosisteminde verinin üretim hızı ve çeşitliliği hızla artıyor. İşletmeler, bu devasa veri yığınlarını stratejik içgörülere ve aksiyon alınabilir analizlere dönüştürerek rekabet avantajı elde etmeye çalışıyor. Bu kapsamlı eğitim kampı, temel veri bilimi ve büyük veri teknolojilerinden derin öğrenmeye, bulut tabanlı büyük veri işleme araçlarından MLOps uygulamalarına kadar uzanan geniş bir müfredat sunuyor. Python programlama temelleriyle başlayan eğitim; NumPy, Pandas gibi kritik kütüphanelerde ustalaşmayı, SQL ve API entegrasyonlarını, keşifsel veri analizini (EDA) ve gelişmiş özellik mühendisliğini kapsayan pratik uygulamalarla devam ediyor.
Yapay öğrenme alanında; denetimli ve denetimsiz makine öğrenimi, derin öğrenme (PyTorch/TensorFlow), bilgisayarlı görü (CNN, transfer learning), doğal dil işleme (transformer mimarileri, LLM’ler) ve generative modeller (GAN, Diffusion) gibi en güncel tekniklere derinlemesine değiniliyor. Büyük ölçekli verilerin yönetimi ve işlenmesi için Spark, Airflow, veri ambarları/veri gölleri gibi modern data engineering araç ve mimarileri inceleniyor. Eğitilen modellerin üretim ortamına alınması, izlenmesi ve yönetilmesini sağlayan MLOps prensipleriyle katılımcılar, uçtan uca bir veri projesinin tüm yaşam döngüsünü deneyimliyor.
Kariyerlerinde fark yaratmak isteyen profesyoneller ile veri bilimi ve büyük veri alanına sağlam bir başlangıç yapmayı hedefleyenler için tasarlanan bu program; teorik altyapıyı pratik projelerle, laboratuvar çalışmalarıyla ve bitirme projesiyle birleştirerek kapsamlı bir öğrenme deneyimi sunuyor.
Bu eğitim, “veriyi bilgiye, bilgiyi aksiyona” dönüştürebilecek uzman veri bilimciler ve veri analitiği profesyonelleri yetiştirmeyi hedefliyor. Program sonunda katılımcıların:
Kurs sonunda katılımcılar, veri bilimi ve büyük veri ekosistemini uçtan uca uygulayabilecek düzeye gelecek; farklı sektörlerdeki (finans, sağlık, teknoloji, perakende vb.) zorlu veri problemlerini çözmeye hazır, kapsamlı bir bilgi birikimine sahip olacaklardır.
Ortak bir teknik temel oluşturmak için hazırlık.
Lab Session:
Python/Conda kurulumunu doğrulama, temel CLI komutlarını uygulama ve GitHub üzerinde tam bir Git iş akışını (repo klonlama, değişiklik yapma, commit etme, push etme) gerçekleştiren egzersizler
Veri bilimi bağlamında temel Python kavramlarını pekiştirme.
Sayısal veri ve vektörleştirme tekniklerinde ustalaşmak.
Tablo verilerinin işlenmesi ve analizi.
Lab Session:
Birden çok veri setini alıp temizleme, birleştirme, özellik mühendisliği ve group-by toplamaları uygulama
Veritabanı kavramları ve ileri düzey SQL sorguları.
Veritabanı ve web servislerinden veri çekme yöntemleri.
Lab Session:
PostgreSQL veritabanından sorgulama, canlı REST API’den veri çekme, verilerin tek bir DataFrame’de birleştirilmesi
Veri özelliklerini anlamak için temel istatistik kavramları.
Veriyi etkili görselleştirme yöntemleri.
Veriyi analiz etme ve içgörüyü aktarabilme süreci.
Lab Session:
Gerçek dünya veri seti üzerinde EDA gerçekleştirme; statik (Matplotlib, Seaborn) ve interaktif (Plotly) grafiklerle içgörü sunma
Ham veriyi modele hazırlama adımları.
Mevcut veriden yeni özellikler türetme yöntemleri.
Önemli bilgiyi koruyarak özellik sayısını azaltma.
Lab Session:
Scikit-learn pipeline kurarak veri ön işleme, ölçeklendirme, kodlama ve özellik seçimi uygulaması
Model eğitimi ve değerlendirme ilkeleri.
Doğrusal ve doğrusal olmayan modellerin uygulanması.
Lab Session:
Regresyon ve sınıflandırma veri setleri üzerinde modellerin uygulanması, çapraz doğrulama ve hiperparametre ayarlaması
Ensemble yöntemlerinin çalışma mantığı ve uygulamaları.
Etiket olmadan veri keşfi ve boyut azaltma yöntemleri.
Lab Session:
Kaggle tarzı tablo veri seti üzerinde hiperparametre ayarlaması, kümeleme algoritmalarının uygulanması (PCA/t-SNE/UMAP görselleştirmeleri) ve anomali tespiti
Daha titiz sonuçlar elde etmek için istatistiksel yöntemler.
Zamana bağlı verilerde temel bileşenler ve modeller.
Bayesian akıl yürütme ilkeleri ve yöntemleri.
Lab Session:
Simüle edilmiş A/B testi verilerini analiz etme, güven aralıkları oluşturma; gerçek dünya zaman serisi verisi üzerinde ayrıştırma ve ACF/PACF grafikleri oluşturma; Bayesian yöntemlerin tartışılması
Sinir ağlarının temel yapı taşlarını ve eğitim sürecini öğrenme.
PyTorch veya TensorFlow kullanarak derin öğrenme modelleri oluşturma.
Mekansal ve sıralı veriler için özel sinir ağı mimarilerinin temelleri.
Lab Session:
Tablo veri seti üzerinde MLP, MNIST/Fashion-MNIST için CNN ve küçük bir metin veri setinde (ör. IMDB) LSTM/GRU uygulaması; TensorBoard ile eğitim takibi
SOTA CNN mimarileri ve önceden eğitilmiş modellerin kullanımı.
Görüntü sınıflandırmasının ötesinde görevler.
Modern CV paradigmaları.
Lab Session:
Önceden eğitilmiş bir ResNet modelinin fine-tune edilmesi, nesne tespiti için YOLO veya SSD ile çıkarım; ViT ve SSL iş akışlarının tartışılması
Dil modellerinde RNN’lerin sınırları ve Transformer’ın avantajları.
Büyük dil modellerinin kullanımı.
Modern tekniklerle LLM’lerle etkileşim.
Lab Session:
Hugging Face transformers ile önceden eğitilmiş modelin fine-tune edilmesi (ör. duygu analizi veya NER), LLM API’leri ile prompt engineering deneyleri; temel RAG sistemi kurulumu
Generative ve discriminative modellerin genel farkları.
Yüksek kaliteli görüntü üretimi için SOTA yöntemler.
Modern sıralı ve graf verisi için alternatif model yapılandırmaları.
Lab Session:
Stable Diffusion kullanarak text-to-image üretimi, farklı prompt’lar, rehberlik ölçekleri ve negatif prompt’larla deneyler; temel bir GCN modelinin uygulanması
Otomatik ve güvenilir veri iş akışlarının oluşturulması.
Büyük veri setlerinin depolanması ve yönetilmesi.
Tek makineden büyük ölçekli verilerin işlenmesi.
Lab Session:
PySpark ile basit veri okuma, dönüşüm ve çıktı işlemleri; Apache Airflow DAG oluşturma; vector database’in LLM/RAG pipeline’a entegrasyonu üzerine tartışma
ML modellerini operasyonelleştirme süreçleri.
Eğitilen modellerin çıkarım için kullanıma sunulması.
Model ve deneylerin izlenmesi ile sürümlendirilmesi.
Lab Session:
MLflow ile model eğitimi, kayıt, Docker konteynerleştirme, API aracılığıyla çıkarım, DVC ve drift tespit araçlarının tartışılması
Korelasyon ve nedensellik arasındaki farklar ve yöntemler.
Karmaşık modellerin yorumlanması ve açıklanması.
AI uygulamalarında etik ilkelerin uygulanması.
Lab Session:
Karmaşık bir model üzerinde SHAP analizi ile açıklama, adalet metriklerinin değerlendirilmesi; potansiyel sapma azaltma stratejilerinin tartışılması
Öğrenilen teknikleri uygulayan gerçek dünya problemlerini belirleme süreci.
Proje hedeflerine yönelik veri toplama ve derinlemesine analiz.
Başlangıç model performansının değerlendirilmesi ve geliştirme planı.
Lab Session:
Özel mentorluk eşliğinde proje üzerinde yoğun uygulamalı çalışma, problem ifadesinin iyileştirilmesi, veri güvence altına alma, kapsamlı EDA ve temel model uygulamasının planlanması
SOTA modelleri uygulayarak nihai çözümün değerlendirilmesi.
Proje metodolojisini, sonuçlarını ve etkisini etkili bir şekilde iletmek.
Veri bilimi alanında başarılı iş arayışına hazırlanma.
Lab Session:
Proje sonlandırma, sunum pratiği, akran ve eğitmen geri bildirimi, sahte mülakat oturumları ve özgeçmiş inceleme atölyeleri
Güncel kalmak ve destek sağlamak için kaynaklar ve networking.
Mezuniyet sonrası iş arama desteği ve işveren ortak ağlarına erişim imkanı.