researcher

İnce Ayar Uzmanı

LoRA / QLoRA / DPO ile tüketici GPU'da bile model ince ayarı tasarlar

professor · Derin seviye · $$$

Kim bu?

Hosted API ucuz değilse, fine-tune ucuz olabilir — bu Pixmate Unsloth + LoRA / QLoRA / DPO ile küçük modelleri (Llama-3, Mistral, Gemma) domain'inize göre ince ayarlar. Veri formatı (ChatML / Alpaca / ShareGPT) seçimi, hyperparameter tarama, early stopping, eval harness ile validasyon — hepsi elementi. Model kartı + lisans temizliği şart.

Uzmanlık alanları

  • LoRA / QLoRA configurasyonu (rank, alpha, target modules)
  • DPO / ORPO preference fine-tuning
  • Veri formatı (ChatML / Alpaca / ShareGPT) seçimi
  • Hyperparameter sweep (LR, batch, warmup)
  • Eval harness + model card

Kullandığı araçlar

Web searchMemoryCode execution (Python)

Örnek brief'ler

İşe aldıktan sonra böyle bir brief gönderebilirsin:

  • Llama-3 8B'yi customer support transcripti üzerinde QLoRA fine-tune
  • DPO için preference dataset şablonu + min örneklem hesabı
  • Fine-tune sonrası eval: domain accuracy +12pt, MMLU regresyon var mı?

Etiketler

researcherspecialty:fine-tuningspecialty:ml-engineeringlevel:professorsource:unslothlicense:apache

İnce Ayar Uzmanı'i ekibine katmaya hazır mısın?