Ses girişi bulunan ve günlük cihazlarda kullanım için optimize edilmiş Gemma 3n kullanıma sunuldu. Daha fazla bilgi

Gemma modeli ince ayarı

Gemma gibi bir üretken yapay zeka modeline ince ayar yapmak, modelin davranışını değiştirir. Gemma'yı genellikle belirli bir görev veya alandaki performansını iyileştirmek ya da müşteri hizmetleri gibi bir rolü daha iyi yerine getirmek amacıyla ince ayar yaparsınız. Gemma modelleri açık ağırlıklarla yayınlanır. Bu, ağırlıkları değiştirebileceğiniz ve modelin davranışını değiştirebileceğiniz anlamına gelir. Gemma modelini ince ayarlamaya yönelik genel adımlar şunlardır:

Bir çerçeve seçin
Veri toplama
Modeli ayarlama ve test etme
Modeli dağıtma

Bir çerçeve seçin

Gemma modelleri, çeşitli yapay zeka ayarlama çerçeveleriyle uyumludur. Her çerçeve çeşitli avantajlar sunar ve genellikle belirli bir model biçimiyle sınırlıdır. Çeşitli çerçevelerle Gemma modellerini ayarlamaya yönelik kılavuzları aşağıda bulabilirsiniz:

LoRA kullanarak Keras
JAX için Gemma kitaplığı
Hugging Face
Google Cloud GKE (HF Transformers ile çoklu GPU)
Google Cloud Vertex AI
Unsloth
Axolotl
Dağıtılmış ayarlamayı kullanarak Keras

Kullanmayı planladığınız dağıtım modeli biçiminin (ör. Keras biçimi, Safetensors veya GGUF) seçtiğiniz çerçeve tarafından çıkış olarak desteklendiğinden emin olun.

Veri toplama

Model ayarlama için veri gerekir. Ayarlama verileri genellikle beklenen yanıtla birlikte giriş verileri çiftlerinden oluşur. Çeşitli görevler veya çıkışlar üzerinde eğitim için internette birçok herkese açık veri kümesi mevcuttur. Örneğin, bir Gemma modelini araba parçası açıklamalarını parça numaralarına çevirmek üzere eğitmek istiyorsanız veri kümeniz şunları içerebilir:

training_data = [
  {"input_text": "Part number for A4 brake caliper", "output_text": "4M0615107BS"},
  {"input_text": "Part number for Beetle fuel pump", "output_text": "6A127026H"},
  {"input_text": "Part number for Camaro cylinder head", "output_text": "12711770"},
]

Bir Gemma modelinin belirli bir görevler dizisini veya rolü yerine getirmesini istiyorsanız genellikle bu görevin birden fazla varyasyonunu gösteren bir veri kümesi derlemeniz gerekir. Bir modeli ayarlamak için ne kadar veriye ihtiyacınız olduğu hedeflerinize bağlıdır. Özellikle modelden ne kadar davranış değişikliği istediğiniz ve modelin, gerçekleştirilecek göreve ve giriş verilerindeki varyasyon düzeyine göre ne kadar iyi performans göstermesini istediğiniz önemlidir.

Genel olarak, görev ayarlama için küçük bir veri kümesiyle başlamanız, eğitim parametrelerini ayarlamanız ve ihtiyaçlarınızı karşılayan görev performansına ulaşana kadar veri eklemeniz gerekir. Örnek uygulamalarımızdan bazıları, yalnızca 20 istem ve yanıt çiftiyle Gemma modelinin davranışını etkileyebileceğinizi gösteriyor. Daha fazla bilgi için Gemma ile işletme e-postası yapay zeka asistanı oluşturma ve Gemma ile konuşma dilinde görevler başlıklı makalelere bakın.

Modele ince ayar yapma ve modeli test etme

Ayarlama çerçevesi ve ayarlama verileri hazır olduğunda Gemma model ayarlama işlemine başlayabilirsiniz. Ayarlama yaparken, ayarlama şeklinize bağlı olarak tamamlamanız gereken kaynakları etkileyen bazı seçenekleriniz vardır. Ayrıca, ince ayar yapıldıktan sonra modelinizin istediğiniz şekilde çalışıp çalışmadığını değerlendirmek için ince ayarlı modelinizle ilgili bir test planınız da olmalıdır.

Parametrelerin verimli kullanıldığı ayarlama

Gemma gibi açık ağırlıklı bir modeli ince ayarlarken modelin tüm parametrelerini ayarlayabilir veya daha az kaynak yoğun parametre açısından verimli bir ayarlama tekniği kullanarak parametrelerin bir alt kümesini güncelleyebilirsiniz. Tam ayarlama yaklaşımı, ayarlama verilerinizi uygularken modelin tüm parametreleri için yeni ağırlıklar hesapladığınız anlamına gelir. Bu yaklaşım, milyarlarca parametre için bu hesaplamaları yaptığınızdan yoğun bir şekilde hesaplama ve bellek gerektirir. Parametrelerin verimli kullanıldığı ince ayar (PEFT) olarak adlandırılan, daha az kaynak yoğunluklu ayarlama yaklaşımları kullanmak (ör. Low Rank Adapter (LoRA) ayarlama gibi teknikler) daha az işlem kaynağıyla benzer sonuçlar üretebilir. LoRA kullanarak daha az kaynakla ayarlama yapma hakkında ayrıntılı bilgi için LoRA kullanarak Keras'ta Gemma modellerine ince ayar yapma ve Hugging Face'te Gemma Modellerine İnce Ayar Yapma başlıklı makaleleri inceleyin.

İnce ayarlı modelleri test etme

Belirli bir görev için ayarladığınız modelin performansını, gerçekleştirmesini istediğiniz görevler grubuyla karşılaştırarak test etmeniz gerekir. Modelinizi, özellikle eğitilmediği görevler veya isteklerle test etmelisiniz. İnce ayar yaptığınız modeli nasıl test edeceğiniz, modelin gerçekleştirmesini istediğiniz göreve ve modelin giriş ve çıkışlarını ne kadar yakından yönettiğinize bağlıdır. Üretken model testini yönetmenin yaygın bir yolu, başarılı, başarısız ve sınırda olan durumları kullanmaktır:

Başarı testleri: Ayarlanmış modelin her zaman başarılı bir şekilde gerçekleştirebilmesi gereken istekler.
Hata testleri: Ayarlanmış modelin, istenmesi durumunda her zaman yapamaması veya açıkça yapmayı reddetmesi gereken istekler.
Sınır testleri: Ayarlanmış modelin, tanımlanmış bir sınır veya kabul edilebilir çıkış davranışının sınırları içinde kalması durumunda gerçekleştirebilmesi gereken istekler.

Üretken yapay zeka uygulamanızda hata veya sınır koşullarını test ederken Sorumlu Üretken Yapay Zeka Araç Seti'nde açıklanan üretken yapay zeka güvenlik yaklaşımlarını, tekniklerini ve araçlarını da uygulamanız gerekir.

Modeli dağıtma

İnce ayarınızı ve testinizi başarıyla tamamladıktan sonra modelinizi dağıtabilirsiniz. Ayarlanmış bir modeli nasıl dağıtacağınızla ilgili bilgileri genellikle seçtiğiniz çerçeveye ait dokümanlarda bulabilirsiniz.

LoRA ile ayarlanmış ağırlıklara sahip bir model dağıtıyorsanız bu teknikle genellikle orijinal modeli ve ağırlıklarını, model için ek bir hesaplama katmanı olarak LoRA ağırlıklarıyla birlikte dağıttığınızı unutmayın.