Analyzing Brand Perception in LLMs
LLM’lerin markalara yönelik yanlılık (bias) ve tutarlılık düzeylerinin değerlendirilmesi.
Sabırsızlık: GPT-4’ün indirim oranı (δ) insanlardan çok yüksekti; GPT-3.5 ve GPT-4 büyük ödülü ertelemeye nadiren yöneldi (sırasıyla %22 ve %16).
Lexicographic davranış (GPT-3.5): Kararlar faiz oranına duyarsızdı; hiçbir geçerli fayda fonksiyonu ile açıklanamıyordu.
Chain-of-thought etkisi: GPT-4’ün büyük ödülü seçme oranını %16’dan %34,5’e çıkardı; ayrıca kararların ardındaki temaları (risk, belirsizlik, fırsat maliyeti) ortaya koydu.
Dil farklılıkları: Zayıf FTR dillerinde (Almanca, Mandarin) GPT’ler daha sabırlı çıktı; bu sonuç literatürle örtüşüyor.
Tematik analiz: Gecikme süresi arttıkça “risk ve belirsizlik” konusuna atıf yapma ihtimali sistematik olarak yükseldi.
LLM Modelleri: 5
Sentetik Veri: 2
Yöntem: 5
Hız: 1
Etik: 1
Doğruluk Oranı: 4
Demografi: 3
Bu makale ile ilgili daha detaylı bilgiye ulaşmak isterseniz buraya tıklayarak ilgili makalenin ekine ulaşabilirsiniz.