LLM Pazarı ve Açık Kaynak Stratejisi
2015 yıllarında veri madenciliği konusunda çalışmaları okurken edindiğim bilgilerle uygulama yapmak için IBM Rapidminer aracını tercih ederek bir çalıştaya ait çıktıları metin madenciliği (text mining) modülüyle analiz etmiştim. O zamanlar anlamlı bir cümle yapısını analiz etmek zor iken günümüze tıpkı bir insana ait (duygusallık konusunda tartışmalı) daha iyi metinleri üreten araçları görmek pek çok kişide olduğu gibi bende de şaşkınlık, hayranlık oluşturdu. Metin üretmenin ötesinde çoğu zaman yaşanılan problemlere karşı da hepimizin olduğu gibi o araçların da gözlüklü amcası Google’dan da daha iyi çözümler sunmaktadırlar.
Elbette Google’ın bu rekabette geride kalması düşünülemez. Bard ile kendinde söz ettirmeyi başardı. Ancak OpenAI ChatGPT’yi pazara sürmeseydi, Google bu ürünleri piyasaya sürmek için bekler miydi? Cevap ne olursa olsun Büyük Dil Modeli pazarının tabana yayılmasında OpenAI şirketinin payı oldukça büyük diyebiliriz.
Büyük Dil Modelleri (LLM) pazarı, hızla büyümekte ve birçok sektörde devrim yaratmaktadır. 2024 yılı itibarıyla, LLM pazarı 6.4 milyar dolarlık bir değere ulaşmıştır ve bu değerin 2034 yılına kadar 85.6 milyar dolara çıkması beklenmektedir. Gelecek on yılda yaklaşık 13 kat büyümek öngörülen bu pazar, dijital dönüşüm ve yapay zeka teknolojilerinin benimsenmesiyle desteklenmektedir. Pazarda önde gelen LLM ürünleri ve pazar paylarının dağılımlarını incelediğimizde halen OpenAI ChatGPT ile liderliğini sürdürmektedir.
OpenAI (ChatGPT): 30%
Google (Bard): 25%
Meta (LLama): 15%
Microsoft (Azure AI): 10%
Amazon (AWS AI): 5%
Hugging Face: 15%
Bu büyük oyuncuların arasına sessiz sedasız ama emin adımlarla giren Alibaba da pazarda yerini almaya başladı. Alibaba’nın amiral gemisi AI temelli dil modeli olan Qwen (veya Çince adıyla Tongyi Qianwen), diğer yerel rakiplerinden farklı olarak açık kaynak olarak sunuluyor. Şirket, bu modeli geliştiriciler ve ticari müşteriler için ücretsiz kullanıma açtı. Qwen, bu yıl Haziran ayında büyük bir 2.0 güncellemesi aldı ve uluslararası alanda büyük beğeni topladı. Hugging Face’in tüm büyük açık kaynak büyük dil modellerinin performansını karşılaştıran en son sıralamasında, Qwen2, Meta’nın Llama 3 ve Microsoft’un Phi-3 modellerini geçerek en üst sırada yer aldı.
Benzer şekilde, DeepSeek ve 01.AI gibi birkaç Çinli startup da modellerini açık kaynak yapmaya karar verdi ve büyük dil modeli ürünlerinin performansı da liderlik tablosunda yüksek bir sıralama elde etmelerini sağladı. Bu tür şirketler, modellerini hem Çin içinde hem de dışında ücretsiz olarak insanlara sunuyor. Doğal olarak şu soru ortaya çıkıyor: Neden? Açık kaynak AI ne anlama geliyor ve bu şirketler neden modellerini daha açık ve erişilebilir hale getirmenin iyi bir iş kararı olacağına inanıyorlar?
Bazı görüşler, bu Alibaba için bulut işini büyütme stratejisinin bir parçası olduğunu savunmaktadır. Eğer açık kaynak modeli popüler hale gelirse, daha fazla insan Alibaba’nın açık kaynak modellerini kullanarak AI uygulamaları geliştirmek için Alibaba Cloud’u kullanacağını sonucuna varmaktadır. Böylece hem bulut hemde LLM pazarı pastadan payını almayı hedeflemekte olduğunu söyleyebiliriz.
Bir diğer görüş geliştirme tarafında, Meta’nın Llama’sı gibi yerleşik açık kaynak modellerini uyarlayarak ürün geliştirme süreçlerini hızlandırmalarına olanak tanır. Pazar tarafında ise, onları ana akımdan farklılaşmalarına yardımcı olabilecek alternatif model mimarileri düşünmeye iter. Şu anda daha iyi bir AI model yapmanın çok sabit bir görüşü var, sadece daha fazla veri eklemek veya büyütmek. Fakat bu LLM pazarına yeni girecek oyuncuların GPT-4 veya Gemini’ye rakip olacak bir model geliştirmesi son derece zor, çünkü OpenAI ve Google’ın eğitim kaynakları konusunda büyük bir avantajı var. Ayrıca start-un ölçeğinde de konuya yaklaştığımızda bu sabit görüşe dayalı geliştirme faaliyetleri oldukça zor olduğundan açık kaynak olarak ürün geliştirmeleri fayda maliyet noktasında iyi bir strateji olabilir.
Özetle açık kaynak AI modelleri, pazarın sadece OpenAI, Microsoft ve Google gibi lider ve büyük oyuncular tarafından domine edilmemesi için alternatif bir gelecek sunuyor.