DataKapital Blog

Datakapital : Twitter Influencer Modülleri

Datakapital Twitter modülleri, ölçülen konularla ilgili tweet atan ve ürettikleri içerikle en yüksek medya etkisini oluşturan hesapları haftalık olarak ölçülerek listelemektedir. İlgili konu hakkında bir önceki hafta yapılmış olan paylaşımlar taranarak o hafta toplam medya içerisindeki payı %0,10 ve üzeri olan paylaşımlar dikkate alınmaktadır. Yapılan çeşitli ölçümlere göre Twitter’daki medya etkisi, belli bir zaman aralığı içerisinde en tepede kalan hesaplarda toplanmaktadır ve takipçi sayısına göre elde edilen gösterim çarpan etkisiyle büyümektedir. Örneğin birebir aynı kalitede 1.000 takipçili bir hesabın alması beklenen gösterim x ise, 2.000 takipçili hesabındaki 2x’ten büyük olacaktır ve bu çarpan etkisi aktif takipçi sayısıyla birlikte logaritmik olarak artacaktır.

Statista’da Felix Richter’in yaptığı bir çalışmaya göre Twitter hesaplarından en büyük %15’i hesabı toplam Tweetlerin %85’ini üretiyor. Bu durum bizim ilk paragta bahsettiğimiz logaritmik etkileşim artışı ile birleştiğinde bütün medya etki gücünün çok az hesapta toplanmasına neden olmaktadır.

Twitter Kullanıcılarının %85'i En Yukarıda

Datakapital daha önce büyük hacimli verileri toplayıp işleyerek bu ölçümleri yapmaya çalışıyordu. Kurucu ortaklarımız 328 milyon veri setiyle Türkiye’nin en büyük hacimli Twitter çalışmasını master tezi olarak tamamladı farklı psikografik yaklaşımlarla etki güçlerini, benzerlikleri ölçmeye çalıştı. (Ulusal Tez Merkezi Tez no:773631)

Tüm bu çabaların neticesinde toplam medya gücü üzerinden kritik içerikleri ölçtüğümüzde aslında tüm etki gücünün %80’inden fazlasını ölçtüğümüzü tespit ettik. Böylece sadece kritik içerikleri taramaya ve derinleştirmeye odaklandık.

Mevcut model bu temel fikri baz alır. Biz Influencer Takip Modülleri ile sadece ve sadece ilgili konudaki hesapların medya etki paylarını/güçlerini ölçeriz. Örneğin Bist twitter influencer takip modülünde, Borsa İstanbul hisse senetleri hakkında Tweet atan ve olası etki yaratabilecek hesapları ölçtük. Finans-Ekonomi modülünde ise yine sadece bu alanda etki oluşturabilecek içerikleri ölçeriz.

Listedeki temel kavramlara kısaca değinirsek;

Etki Skoru : İlgili konuda ölçülen bir hesabın sadece ve sadece medya etki gücünü ölçen skordur. Bu skor ilgili konudaki hesabın güvenilirliğine, şeffaflığına ya da herhangi bir etik standartına referans vermez ve insanlar tarafından kalitatif olarak değerlendirilmez. Belli bir algoritmadan geçerek tamamen mekanik olarak şekillendir.

Algoritma öncelikle Twitter’ın search foksiyonu üzerinden ilgili konuyu betimleyici olduğu tespit edilmiş olan anahtar kelimelerle tarama yapar. Bu tarama neticesinde ilgili zaman aralığı için belli bir görüntüleme ve medya gücü üzerinde kalan içerikler tespit edilir. Taranan tüm içerikler Twitter’ın arama fonksiyonundan döndürdüğü ve tavsiye ettiği içeriklerdir, Datakapital hiçbir insiyatif kullanmaz.

Ardından ilgili içerikler toplanarak makine öğrenimi ile eğitilmiş olan sınıflandırıcıya verilmektedir. Bu veri temizleme sınıflandırıcısı içerikleri konuyla ilgili olanlar ve olmayanlar şeklinde rafine eder. Çünkü Twitter’ın arama fonskiyonundan ilgili anahtar kelimelere göre döndürülen her içerik konuyla ilgili olmayabilir. Filtreden geçen içerikler aldıkları görüntüleme, yeniden gönderim ve beğeni sayılarına göre değerlendirilerek bir etki skoru oluşturulur. Bu etki skorunda en büyük çarpan görüntülemedir.

Skorlara göre ilgili haftada toplam medya etki gücünün yaklaşık %80’inden fazlasını taramış oluruz. Ardından bu pay içerisindeki oranı %0,10 ve altı olan içerikleri de temizleyerek analizden çıkarırız. Kalan içeriklerin etki skorları, içerik sahiplerine yazılacaktır.

Bir hesabın birden fazla içeriğinin filtreyi geçmesi durumunda en yüksek etki skorlu içerik temel alınarak diğer içeriklerin etki skorları azaltılır ve yine hesaba eklenir. Bunun nedeni sürekli yüksek görüntüleme alan içerikleri üreten bir hesabın genelde kendi kitlesine içeriği mükerrer olarak gösteriyor olmasıdır. Bu yüzden aynı hesabın içeriklerinin toplam görüntülemesi doğrudan medya gücünü vermez.

Etki skoru haftalık olarak güncellenir ve kümülatiftir. Her hafta, önceki haftanın toplam etki skoru %10 azaltılır ve ilgili haftanın etki skoru hesaplara eklenir. Yine yaptığımız çalışmalar neticesinde Twitter’daki etki gücünün dinamik olduğunu ve 3 aylık bir süreye yayılarak yavaş yavaş azaldığınız tespit ettik.

Spam Skoru : 0-100 arasında bir değer alan bu skor, tespit edilen içeriğin spam niteliği olup olmadığını tespit eder. Burada spam için eğitilmiş makine öğrenim modülü aşağıdaki parametrelere göre içeriğe bir spam skoru atar. Spam skoru kümülatiftir ve haftalık olarak düzeltilir. Ortalama değerlerde esnekken, uç değerlerde katıdır. Örneğin spam skoru çok fazla yükselmiş bir hesabın skoru gelecek hafta, spam skoru daha düşük bir hesaptan daha hızlı düzelecektir. Spam skoru, doğrudan etki skoruna negatif yönlü olarak etki eder ve etki skorunu haftalık olarak azaltır. Spam skoru arttıkça, spam niteliğinin arttığını ve azaldıkça bu niteliğin düştüğünü belirtir.

Aşağıdaki olası içerik tipleri spam skoru yükseltir:

  1. Yoğun hashtag kullanımı: Twitter aşırı hashtag kullanımını cezalandırsa bile bu tip içerikleri arama fonksiyonundan döndürmektedir. Fazla hashtag kullanımı görüntüleme ve doğal olarak etki skorunu yapay bir biçimde arttırır. Bu durum spam skoru arttıracaktır.
  2. İçerik eksikliği: Twitter’ın doğrudan amacına uygun olmayan ve metin zenginliği eksik olan paylaşımları kast eder. Örneğin tek bir fotoğrafla ya da video ile yapılan paylaşımlar. Yaptığımız ölçümlere göre bu tip içeriklerin genelde hızlı görüntülenen ve yayılan ancak yine hızlı gündemden düşen, etkisi hızlı azalan içeriklerdir ve çoğunlukla doğrudan konuyla ilgisiz mecaz, mizah vb. paylaşımlardır.
  3. Bağlam dışı içerikler: Mizah, mecaz vb. bilgilendirici olmayan paylaşımlar ya da ilgili konuya etkisi olsa bile bağlam olarak kenarda kalan içeriklerdir. Eğer hem önceki maddedeki gibi metin eksik hem de içerik bağlam dışıysa ayrı ayrı spam kategorileri için kümülatif olarak cezalandırılacaktır.
  4. Etki transferi: İçeriğin ölçülen konuyla doğrudan ilgisi olsa bile başka bir platforma yönlendirme ya da etki transferi yapması. Örneğin influencerın telegram hesaplarına, web sitesine ya da bir kuruma yönlendirme yapılması gibi.
  5. Reklam ve kişisel övgü: Kendinin ya da başka bir hesabın doğrudan reklamının yapılması ya da daha önceki isabetli tahminlerin referans verilerek şahsi övgü yapılması gibi paylaşımlar spam konusudur. Bunun nedeni içeriğin kalitesi değil, medyanın mükerrer ölçümüdür. Hesabın 1 ay önce yaptığı paylaşımdaki isabeti göstererek etkileşim alması 1 ay önceki medyanın yeniden ölçülmesine neden olur.
  6. Doğrudan illegal/mevzuata aykırı paylaşımlar: Doğrudan hisse senedi tavsiye edilmesi, çekiliş yapılması, kamu düzenini ya da toplum moralini bozucu provokatif paylaşımlar en yüksek kategoride spam olarak cezalandırılırlar.
  7. Provokatif yönlendirme ve iddialar: İlgili konudaki bir olayın kesin olacağı iddiası örneğin Bist modülü için, Borsa İstanbul’un kesin yükseleceği ve düşeceği vb. iddialar, provokatif üslup spam skorun artmasına neden olacaktır.

Spam skoru etki skorunu haftalık olarak azaltsa da medyanın etki gücü yine de dikkate alınır ve ilgili hesap listeye girer. Çünkü bir iddia provokatif olsa bile medya gücü oluşturabilir ve daha önce belirttiğimiz gibi sadece medya gücünüz ölçeriz. Doğrudan hukuki sürece dahil olmayan ve hukuki kararlarla bizden kaldırılması talep edilmeyen her içerik ve hesap analizin konusudur. Spam skorda doğrudan algoritmayla atanır ancak çok yüksek spam değeri döndüren içerikler, etki skorundan farklı olarak analist tarafından ayrıca incelenir. Bu inceleme spam değerini bir miktar değiştirse de analist algoritma aralığında belirlenmiş değerlerin dışında bir değer ataması yapamaz ve bu düzeltmenin skora etkisi minimaldir.

Medya Etki Payı : İlgili konudaki toplam etki skoru içinde influencerın payını gösterir. Listelediğimiz toplam etki tüm medya etkisinin yaklaşık %80’ini oluşturur ve kalan %20’lik etki farklı hüçük hesaplar arasında normal olarak dağılırlar. Bu yüzden listedeki etki payı toplamı %80’e tekabül eder. Bir influencerın medya etki payı o konudaki tüm paylaşımlar içerisindeki etki gücünü temsil eder.

Sık Sorulan Sorular

Soru: Çok yüksek takipçili olduğunu düşündüğüm bir hesabı listede göremiyorum. Takipçi sayısı önemli bir parametre değil mi?

Cevap: Değil, daha doğrusu takipçi sayısının etki skoruna etkisi sıfırdır. Biz bir hesabın potansiyel değil aktif/kinetik etki gücünü ölçeriz. Hesap paylaşımda bulunmuyor olabilir ya da paylaşımları medya etkisi oluşturmamış ve görüntüleme almamış olabilir.

Soru: Peki takipçi sayısı yüksek olan hesapların medya etkisinin daha yüksek olması beklenmez mi? Listede benzer paylaşımı yapan düşük takipçili hesaplar görüyorum.

Cevap: Takipçi sayısı ile görüntüleme arasında ilişki olsa da, medya etkisi aktif hesap sayısına göre çok farklılaşabilir. Çok fazla takipçisi olduğunu düşündüğünüz hesapların paylaşımları, düşük görüntüleme alıyorsa temel sebebi takipçi kitlesindeki büyük bir oranın eski/pasif hesap olmasıyla ilgilidir. Hesapları mukayeseli olarak profillerine girip incelerseniz içeriklerin aldıkları görüntüleme üzerinden bu bilgiyi teyit edebilirsiniz.

Soru: Fazla etkileşim ve görüntüleme almış ve konuyla doğrudan ilgili olan bir içeriği paylaşan hesabın listenizde olmadığını gördüm. Bunun nedeni ne olabilir?

Cevap: Birkaç senaryo mümkündür.

a-)Twitter bir sebepten bu kişinin içeriklerini arama arayüzüne çıkarmıyor olabilir. Hesap spam kabul ediliyordur ya da bir sebepten Twitter tarafından ilgili konuda tavsiye edilmiyordur.

b-)Etkileşim zannettiğiniz kadar yüksek olmayabilir genellikle bir içeriğin filtreden geçmesi için 30 bin ve üzeri görüntüleme alması beklenir. Bazen bu rakam bile etkileşim sayısındaki zayıflıktan dolayı yetmeyebilir.

c-)Taramaya yeni başladığımız bir konudur ve hesap henüz listeye eklenmemiştir ve yukarıdaki sebeplerden biri yoksa gelecekte mutlaka eklenecektir.

Soru: Listenizde gördüğüm bir hesabın ilgili konuda yetkin olmadığını ve kalitesiz paylaşımlar yaptığını düşünüyorum. Bu hesap neden listede?

Cevap: Biz sadece medya etki gücünü ölçüyoruz ve içerik kalitesini hiçbir şekilde kalitatif olarak değerlendirmiyoruz. İnsanlar bu kişinin paylaşımlarına rağbet ediyorsa medya etki skoru yüksek olacak ve listeye dahil olacaktır.

Soru: Listedeki bir hesabın, listedeki konuyla ilgili bir biosu olmadığını ve bu konuda düzenli olarak paylaşım yapmadığını düşünüyorum bu hesap neden listede?

Cevap: Bir hesabın ilgili konuda aktif medya etki gücü oluşturması için o hesabın profil bilgilerinin konuyla ilgili olması ya da bu konuda düzenli paylaşım yapması gerekli değildir. Bir hafta liste konusuyla iligili medya etki gücü yüksek bir paylaşım yaptığı için listeye dahil olur. Bu durum sürekli olmadığında etki skoru zaman içinde azalarak düzenli paylaşım yapan hesapların arkasına düşecektir.

Soru: Bir hesap daha önce listedeydi ancak artık listede göremiyorum

Cevap: Toplam medya etki payı %0,01’in altına düşen hesaplar otomatik olarak listeden çıkarılmaktadır. Yeniden medya etkisi oluşturduklarında dahil edileceklerdir.

Soru: Size bir hesabın listeye eklenmesi için toplu olarak mesaj attık ve talepte bulunduk. Bu hesap listeye eklenir mi?

Cevap: Datakapital’in oluşturduğu veri işleme algortiması bir otomasyondur ve doğrudan hukuki yollardan talepler dışında otomasyona hiçbir şekilde müdahale edilmez ve algoritma dışında insiyatif kullanılmaz. Amaç insan faktörünü minimize ederek uygulanabilir ve objektif bir kurumsal standart oluşturmaktır.

Exit mobile version