Veri
Karmaşık veriyi anlaşılır içgörüye dönüştürüyorum. Python ve Pandas ile veri temizleme, kalite kontrolleri ve keşifsel analiz yapıyor; Looker Studio, Power BI ve GA4 ile karar verdiren dashboard'lar kuruyorum.
Detaylar →👋 Merhaba, ben Tuba.
Mad Cat Labs'ta Data & AI Associate olarak çalışıyorum. İşim ham veriyi anlamlandırmakla başlıyor, dil modelleri eğitmeye ve bu modelleri üretime, yani gerçekten işe yarar ürünlere taşımaya kadar uzanıyor. Veri mühendisliğinden fine-tuning'e, değerlendirmeden dağıtıma kadar sürecin her aşamasında yer alıyorum. Web tarafında da fikirleri canlı projelere dönüştürmeyi seviyorum. Bu yolda öğrendiklerimi @tubac3l1k'te ve Medium'da paylaşıyorum.
Karmaşık veriyi anlaşılır içgörüye dönüştürüyorum. Python ve Pandas ile veri temizleme, kalite kontrolleri ve keşifsel analiz yapıyor; Looker Studio, Power BI ve GA4 ile karar verdiren dashboard'lar kuruyorum.
Detaylar →Türkçe dil modelleri eğitiyorum. 200.000+ satırlık eğitim setleri, Qwen, Gemma ve farklı model aileleriyle fine-tuning (LoRA/DPO), değerlendirme pipeline'ları ve on-prem dağıtım. Uçtan uca LLM geliştirme.
Yazılarımı oku →Modern, kişiselleştirilmiş web siteleri tasarlıyor ve hayata geçiriyorum. Temiz tasarım dili, responsive yapı ve markaya özgü bir his. HTML, CSS ve JavaScript ile fikirden canlı siteye kadar.
Projelerime bak →
Türkçe dijital pazarlama için uçtan uca dil modeli geliştirme. 12 alanı kapsayan 200.000+ satırlık sentetik eğitim seti kurdum, JSONL pipeline'ı tasarladım ve yüzde 94 format uyumu sağlayan otomatik kalite doğrulaması ekledim.
2B'den 27B'ye dört Qwen varyantını LoRA ve DPO ile karşılaştırdım. 27B'deki token açığını teşhis ederek üretim katmanı kararını şekillendirdim. Bulguları yazıya döktüm: 2.000+ görüntülenme.
Skorlama pipeline'ını denetleyip ölçülen performansı yaklaşık 15 puan baskılayan 12 artı metrik tutarsızlığını tespit ettim ve 200 artı soruda standart metriklerle yeniden tasarladım.
Gemma ve Qwen ile güvenli, şirket içi bir LLM platformu kurulumuna katıldım. Ollama ve Open WebUI üzerinde model serving, DGX Spark altyapısında dağıtım deneyimi.
Mad Cat Labs'ta Türkçe LLM geliştirme üzerine çalışıyorum. MMX projesinde 200.000+ satırlık, sentetik ve gerçek veriden oluşan bir eğitim seti kurduk, Qwen ve Gemma gibi farklı model aileleriyle LoRA ve DPO fine-tuning deneyleri yürüttük, değerlendirme pipeline'larını tasarladık ve on-prem dağıtıma katıldık.
Uzun yıllar dijital analitikte ve performans pazarlamasında çalıştım. O dönemde verinin nasıl okunduğunu, dönüştürüldüğünü ve karara çevrildiğini öğrendim. Şimdi bu altyapıyı yapay zeka tarafına taşıyorum: n8n ile otomasyon kuruyor, model çıktılarını değerlendiriyor ve geliştirme süreçlerini kolaylaştıracak araçlar inşa ediyorum.
Öğrendiklerimi paylaşmayı seviyorum. Instagram'da (@tubac3l1k) gündelik içerik, Medium'da daha uzun teknik yazılar paylaşıyorum. İki kanal da Türkçe, çünkü yapay zekada Türkçe kaynak açığı çok büyük ve bunu kapatmaya katkıda bulunmak istiyorum.
Türkçe yapay zeka ve teknoloji içerikleri üretiyorum. Karmaşık konuları sade, erişilebilir bir dile çeviriyorum.
Yapay zeka ve teknoloji içerikleri. Gündelik Türkçe paylaşımlar.
LLM geliştirme, fine-tuning ve veri mühendisliği üzerine teknik yazılar.
Bir projen mi var, ya da sadece merhaba mı demek istiyorsun? Yazmaktan çekinme.
tubacelikk11@gmail.com