DataKapital Blog

Sosyal Medya Verileri ile Sentiment Analiz Tekniği

Sentiment analizi ile ilgili veriler 3, sosyal medya, reddit, subreddit

Öz

Gelişen teknolojiyle beraber insanların sosyal medya platformlarını kullanımlarında gözle görülebilecek derecede artış meydana gelmiştir. Bu platformlar büyük hacimli portföy ve danışmanlık şirketlerinin yanı sıra daha küçük hacimli oyuncuların hisseler karşısındaki tepkilerini paylaşabilecekleri alan olarak ortaya çıkmaktadır. Daha küçük hacimli sermayeye sahip olsalar da sayıca fazla olan oyuncuların hisseler üzerindeki etkisi bu çalışmanın konusunu oluşturmaktadır. Bu çalışmada küçük hacimli oyuncuların paylaştığı sosyal medya gönderilerinin hisseler üzerindeki etkisi incelenecektir. Elde edilen veriler ışığında nicel olarak fazlaca bulunan bu tür borsa oyuncuları, paylaştıkları gönderiler sayesinde hisseleri olumlu ya da olumsuz etkileyebilecekleri ortaya çıkmaktadır. Ayrıca küçük sermayeli borsa oyuncularının birbiri üzerinde etkileri sosyal medya platformlarının incelenmesiyle ortaya çıkacaktır.

Giriş

Sosyal medya platformları günümüz dünyasını şekillendiren en önemli etkenlerden biri haline gelmiştir.  Sosyal medya platformları insanların duygu ve düşüncelerini paylaştıkları mecralardır. Geçmişe göre kullanımı hızla artan bu platformlara her geçen gün yenileri eklenmektedir. Bugün geldiğimiz noktada Reddit, Meta, Twitter gibi mecralar insanların neredeyse günlük yaşamda olduğundan çok daha fazla birbirleriyle etkileşimde bulundukları platformlardır. Sosyal yaşamda etki edilebilecek insan sayısı görüşme sıklığıyla kısıtlıyken sosyal medya platformlarında bu durum doğal olarak ortada yoktur. Bu sayede insanlar tek bir paylaşımla milyonlarca kişiye ulaşabilmektedirler. İnsanlar her konuda olduğu gibi borsa hakkında da sosyal medya platformlarına çok fazla paylaşım yapmaktadırlar. Bu sayede sosyal medya platformlarında borsa hakkında bir veri havuzu oluşmaktadır. Bu veri havuzunun – big data –  sentiment analiz yönteminden geçirilerek tasnif edilmesi sonucu borsa öngörümlenmesi sağlanabilmektedir. Bu makalede; sentiment analiz tekniğinin açıklanması ve Twitter verileri ile sentiment analizin yapılabilirliği, Twitter’daki gönderilerin Borsa İstanbul(BİST) hisseleri üzerinde etkisi, küçük sermayeli birbirinden bağımsız topluluk hareketlerinin sentiment analiz ile öngörümlenmesi, teknolojinin ilerlemesi ile beraber gelecekte sentiment analizin yeri açıklanacaktır.

I.   Sentiment Analiz Tekniğinin Açıklanması ve
Twitter Verileri ile Sentiment Analizin Yapılabilirliği

Sentiment analiz tekniği yapı olarak Python yazılımı üzerine bina edilmiştir. Alenileştirilmiş verilerin kullanılabilirliği durumundan dolayı Türkiye Cumhuriyeti’nde paylaşılmış her veri kullanılabilmektedir. Türkiye’de bugün Datakapital A.Ş.  gibi birçok şirket bu tip veri işleme tekniği ile borsa öngörümleme servisi sunacaktır/sunmaktadır. Bu şirketlerin sunduğu hizmetin temel mantığı twitter, reddit gibi borsa üzerine paylaşım sayısı oldukça fazla olan internet sitesinden  – paylaşılan verileri- verileri çekmek sureti ile elde edilen verilerin python yazılımı aracılığıyla 0, -1 yada 1 olarak sınıflandırılmasıdır. [1] Bu sınıflandırmada 0 nötr/duygusuz, -1 negatif/olumsuz, 1 olumlu/pozitif anlamına gelmektedir. Bu sayede her hisse hakkında duygusal dağılım elde edilmiş olmaktadır. Bu dağılımlar sonucunda pozitif duygu durumu daha yüksek olan hisselerin ileride artacağı gösterilmektedir.

Twitter verileri ile yapılan sentiment analizde önemli noktalardan biri hashtag dediğimiz mekanizmanın kullanılmasıdır. Hashtag mekanizması ile çekilen tweetlerde bol miktarda alakasız tweet bulunabilmektedir. Python ile oluşturulan yapay zekanın yanlış veri işlememesi için yapılması gereken sosyal bilimci çalışanların bu verilerin bir bölümünü kendilerinin de işlemesidir. Bu sayede yapay zekaya yeni bir rota da oluşturulmuş olmaktadır. Sosyal bilimcilerin işlediği verilerin kesinliği (accuracy) ise diğer sosyal bilimci çalışanlarla kıyaslanarak ortaya koyulabilmektedir. 1000 tweetten  en az %85’inin uyuştuğu iki sosyal bilimci çalışanın okuduğu verilerin kesinliği yüksek demektedir. Bu sayede yapay zekanın kesinliği arttırılmaktadır. Çalışanların sosyal bilimci ya da sosyal bilimlerle ilgili kişilerden seçilme nedeni ise okudukları verileri anlayabilme ve sosyolojik analiz yapabilme kapasitesine sahip olmaları gerekliliğindendir. Bu sürecin sonunda elde edilen tasnif aylık abonelik veya direkt satım olarak pazara çıkmaktadır. Bu tasnifi satın alan bireyler aldıkları ve alacakları hisseler üzerinde pazarın duygu durumunu elde etmiş olacaklardır. Bu edinim hizmeti satın alan kişi ve kurumlara borsa üzerinde öngörümleme imkânı sunmaktadır. Araştırmalara göre – “Sosyal Medya  Platformlarının Hisse Senedi Piyasalarına Etkisi: BIST 30 Örneği”, “ Twitter verileri ile duygu analizi” – her pozitif yorum hisseler üzerinde yukarı yönlü bir hareketlenme oluşturmaktadır. Bu sayede ileride hisse grafiğinin ileride ne yönde seyredeceği tahmin, tahmin edilebilmektedir.

II.   Twitter’daki Gönderilerin BİST Hisseleri
Üzerine Etkisi

Twitter’ da BİST hakkında atılan tweetler BİST grafiğini olumsuz ya da olumlu anlamda etkide bulunmaktadır. Bu durum “Sosyal Medya Platformlarının Hisse Senedi Piyasalarına Etkisi: BIST 30 Örneği” adlı makalede şu şekilde açıklanmaktadır.

Sonuçlar her bir şirket için ayrı ayrı değerlendirilecek olursa; negatif değişkenine ait katsayı ARCLK, ASELS, EREGL, GARAN, KOZAA, KOZAL, PGSUS, SAHOL, SODA, VAKBN için anlamlıdır. ARCLK, EREGL, GARAN, KOZAA, KOZAL, SAHOL, SODA ve VAKBN için katsayı beklendiği gibi negatif işaretlidir. Bu şirketler hakkında atılan olumsuz tweetler şirkete ait hisse senedi getirisini olumsuz etkilemektedir. 

ASELS ve PGSUS için ise beklenenin aksine pozitif işaretlidir. Pozitif değişkenine ait katsayı ARCLK, GARAN, KOZAA, KOZAL, PGSUS, SISE, TKFEN ve VAKBN için anlamlıdır. ARCLK, GARAN, KOZAA, KOZAL, TKFEN ve VAKBN için katsayı beklendiği gibi pozitif işaretlidir. Bu şirketler hakkında atılan olumlu tweetler şirkete ait hisse senedi getirisini olumlu etkilemektedir. PGSUS ve SISE için ise beklenenin aksine negatif işaretlidir. Hacim değişkenine ait katsayı ASELS, HALKB, ISCTR, KOZAA, KOZAL, KRDMD, SAHOL, THYAO, TOASO, TSKB, TTKOM ve VAKBN için anlamlı ve beklenti paralelinde pozitif işaretlidir. Bu şirketler için işlem hacmindeki artış, şirket getirisini artırmaktadır[2]

Sentiment analizi ile ilgili veriler 3, sosyal medya, reddit, subreddit

Adı geçen makaledeki sonuç göz önüne alındığında twitter verilerinin BİST üzerinde net bir etkiye sahip olduğu gözler önüne serilmektedir. Makalede BİST 30 içindeki hisselerin bir zaman dilimi içerisindeki verileri ile hisse hareketleri sonucu bir tutarlılık göz önüne konmaktadır. Bu sayede Twitter girdilerinin duygusal dağılımı ile BİST 30 grafiği arasında bağlantı oluşmaktadır.

III.
Küçük Sermayeli Birbirinden Bağımsız Topluluk Hareketlerinin Sentiment Analiz
ile Öngörümlenmesi

Küçük sermaye sahibi – 1.000.000 dolar ve aşağısı – yatırımcıların manipüle girişimleri sentiment analiz yardımıyla öngörülebilmektedir. Reddit günümüzde birçok subreddite [3] ev sahipliği yapan legal internetin en büyük forum platformudur. Subreddit isimli birçok forumdan meydana gelen Reddit’te borsa manipülasyonu için birbiriyle iletişim haline geçmeye çalışan küçük sermaye sahibi yatırımcılar da mevcuttur.

Bu yatırımcıların kullandığı subredditlerden biri olan WallStreeBets adlı subredditte birleşen milyonlarca küçük yatırımcı GameStop adlı kâr marjı olmayan hisseyi manipüle etmeye çalışmıştır. Bir noktada adı geçen hisse tamamen yok olmayla karşı karşıya iken talebi doğal olmayan biçimde ekstrem şekilde arttıran WallStreetBets yatırımcıları hissenin değerinin fazlaca yükselmesini sağlamışlardır. Bir süre hisseyi tutan buna da “hodl” diyen bu topluluk hissenin değerinin balinalara [4] karşı da düşmesini engellemişlerdir. Fakat günün sonunda JPMorgan gibi en büyük portföy şirketlerinin de yönlendirmeleri sonucu hisse doğal haline gelmiştir.

Bu olayda görülmesi gereken WallStreetBets platformunu düzenli olarak analizleyen sentiment analiz yapan bir yapay zekanın hissenin ilerlemişini önceden öngörebileceğidir. Balinaların yaptıkları girişimlere karşılık günümüzde sosyal mecraların gelişmesi ile de birlikte küçük yatırımcılar bir bakıma birleşerek büyük portföy şirketleriyle hisseler üzerinde yarışabilir hale gelmişlerdir. Sentiment analiz ve data işleme tekniği ile WallStreetBets’in okunan girdileri sayesinde bu olay öngörülebilecektir. Aşağıda verilen örnek girdiler WallStreetBets’in nasıl çalıştığı hakkında fikir vermektedirler.

Sentiment analizi ile ilgili veriler
Kaynak: https://www.reddit.com/r/wallstreetbets/comments/uu307e/time_to_buy_coming/
Sentiment analizi ile ilgili veriler 2, sosyal medya, reddit, subreddit
Kaynak: https://www.reddit.com/r/wallstreetbets/comments/uu6hc6/if_pelosi_cant_beat_this_market_what_hope_do_we/

İlk paylaşımın sentiment analizdeki değeri 1’dir çünkü kişinin (u/Aubiepolo) heyecanı burada söz konusudur. Satın alma zamanının gelmesi aynı zamanda hisse için de pozitif bir değere sahiptir çünkü değeri yükselecektir. Bu noktada pozitiflik ile hissenin değer kazanımı arasındaki bağlantı görülebilmektedir.

İkinci paylaşım da bir serzeniş söz konusudur. Bundan dolayı bu paylaşımın değeri -1’dir. Bu negatif bakış açısı paylaşın grafikte görüldüğü gibi hisseye negatif ivme kazandırmıştır.

Bu girdilerde de görülebileceği üzere subredditteki yatırımcılar birbirlerine öneri vermekte ve grafik göstermektedirler. Bu sayede birbirlerine satın alınabilecek, alınamayacak veya satılabilecek hisseleri iletmektedirler. Bu bağlantıyı bir zaman dilimi içerisinde – ay, hafta veya yıl – işleyebilecek bir çipset çözümü, depolayabilecek bir server sayesinde Reddit’teki meşhur subredditler (örneğin: WallStreetBets, 12 milyon takipçiye sahip) okunup tasnif edilebilirler. Bunun sonucunda elde edilen verinin değeri Twitter’dan elde edilen veriden daha yüksek olacaktır. Twitter’ın bu aşamada Reddit’e karşı en büyük eksiği takipçi sayıları ve kullanıcı tipi yüzündendir. Twitter’da insanların borsaya ilgisi gözle görülebilecek kadar azdır. Genel geçer borsa analizleri olmakla birlikte borsaya dahil detaylı analizlerin çoğunun takipçisi Reddit’tekilerle kıyaslanamayacak kadar azdır. Bunun temel sebebi Twitter’da ortak bir “alt forum” olmamasıdır. Subreddit’teki herkesin tek konusu borsadır. Geçmişte manipülasyon işlemini bilfiil isteyerek yapan bir topluluk olduklarından mütevellit daha değerli data ortaya koymaktadırlar.

Subredditlerdeki upvote/downvote olarak isimlendirilen basitçe destekliyorum veya desteklemiyorum butonu bu konuda ekstra önemlidir. Bu noktada sentiment analiz açısından yapılması gereken şey upvote oranı yüksek olan paylaşımların çıkan sonuçtaki etkilerinin daha fazla olması yönündedir. Bunun en temel nedeni Reddit’in kendi içerisinde kurmuş olduğu hot (sıcak) bölümüdür. Bu bölümde yakın zamanda paylaşılmış ve yüksek upvote almış gönderiler “başta” bulunmaktadırlar.

Başta bulunmanın sosyal mecralarda en büyük artısı görüntülenmenin daha fazla olmasıdır. Bunun neticesinde daha fazla insana ulaşan bu gönderi daha fazla kullanıcıyı etkileyecektir. Upvote oranı yüksek olan gönderilerin aynı zamanda borsa subredditlerinde daha fazla desteklendikleri açıktır. Bu nedenle paylaşımın pozitif olması durumunda daha pozitif, negatif olması durumunda daha negatif etkiye sebep olacaklardır. WallStreetBets gibi subredditlerin en büyük yönü birbirlerini destekleyen insanları bir araya gelmesidir. Bu nedenle bu tarz subredditlerde daha fazla desteklenen paylaşımlar analizin sonucu oluşan grafiğe daha fazla etki etmelidirler.

IV.
Teknolojinin İlerlemesiyle Gelecekte Sentiment Analizin Yeri

Big datanın her geçen gün daha büyük hale gelmesiyle beraber sentiment analiz ile elde edilebilecek ürün skalası genişlemektedir. [5] Özellikle politikada kullanılmaya uygun olan bu yöntem insanların neler konusunda nasıl hissettiğini öğrenmeyi kolaylaştıracağı için sentiment analiz yöntemi kampanya yapan partilerin kamu nabzı ölçerken kullandıkları enstrümanlardan biri olacaktır. Günümüz politikasında bile dataların satılması olayı çok meşhur iken gelecekte artan data ve “detaylanan” data miktarı ile bu durum daha ehemmiyetli hale gelecektir. [6] İnsanların ne ile ilgili nasıl düşündüklerinin ortalamasını saptayabildiğimiz sentiment analiz sistemi ise bu gibi durumlarda tehlikeye bile yol açabilecektir.

Sentiment analiz yönteminin ana unsuru datadır. Datanın çokluğu analizin kesinliğini arttıracağından dolayı big datanın büyümesi bu yöntemin kullanışlılığını da arttıracaktır. Dataya işlemede sadece üç ana duygu belirleme yöntemini kullanmasını kullanılan işlemciyi daha az yoracaktır. İşlemcilerin gelecekte ne kadar gelişme göstereceği big datanın işlenmesi için hayati önem arz etmektedir.

Sonuç

Sentiment analiz tekniği borsa ön görümlemede kullanılan en önemli tekniklerden bir tanesidir. Sentiment analizin yapısı Twitter, Reddit gibi platformlarda borsa hakkında paylaşılan girdileri okuyup bir tasnif yapacak düzeydedir. Ayrıca elde edilen bulgulara göre atılan her tweetin borsa üzerinde negatif veya pozitif etkisinin olması bu yöntemi daha değerli kılmaktadır.

Reddit’in ekonomi ve borsa üzerine açılan ve mütemadiyen ekonomi, borsa sohbetleri, manipülasyonları yapılan subredditleri bu analiz yönteminin kullanılması için uygun bir alandır. Bu alanda çalışma yapacak veri analizcilerinin üstünde durması gereken konu upvote ve downvoteun çıkan tasniflerdeki ağırlığının arttıracak yönde değiştirilmesidir. Girdiler bu orana göre dağıldığında elde edilen sonuç dağılmaksızın elde edilen sonuçtan daha değerlidir çünkü upvote sistemi Reddit’te öne çıkmayı sağlayıp daha fazla insana nüfuz etmeyi sağlamaktadır.

WallStreetBets gibi platformlarda bir konsensüs içinde olmadan fikirlerini paylaşan küçük sermayeli yatırımcıların konsensüse varıp manipülatif hamle yapmalarını ön görebilecek analiz türü sentiment analizdir. Aktif duygu dağılımı yapılan girdilerin topluluğun hamlelerini gözler önüne sereceği açıktır. Ürünü satın alan kullanıcı bu sayede manipülatif hamleleri önceden tespit edebilecektir. Teknolojinin ilerlemesi ile beraber artacak olan veri miktarı veri işlemedeki kesinliği doğal olarak arttıracaktır. Bu sayede sentiment analizde de daha kesin sonuçlara ulaşılabilecektir. Bu durum artan veri sayısıyla beraber işlemci teknolojisinin gelişimine de bağlıdır.

Dipnotlar:

[1] Albayrak Mehmet, Kamil Topal, Volkan Altıntaş. “Sosyal Medya Üzerinde Veri Analizi: Twitter”. Süleyman Demirel Üniversitesi İktisadi ve İdari Bilinler Fakültesi Dergisi C.22, Kayfor 15 Özel Sayı, s. 1991,1998. (2017)

[2] Muhammet Özcan. “Sosyal Medya  Platformlarının Hisse Senedi Piyasalarına Etkisi: BIST 30 Örneği”. Gümüşhane Üniversitesi Sosyal Bilimler Enstitüsü Elektronik Dergisi. 12(1). 160-172. (2021)

[3]  Reddit denilen sosyal medya platformu subredditlerden oluşmaktadır. Subreddit  kendi başına bir forumdur. Bu forumun kendine özgü yöneticisi veya yöneticileri mevcuttur. Subredditlerde insanlar belirli konular hakkında paylaşım yaparlar. Subredditlerin ara yüzü birbirine benzemektedir. Bu durum Reddit’in ara yüzünü kullandıklarından dolayı oluşmaktadır. Tüm subredditler Reddit platformuna bağlıdır. Reddit yöneticileri subredditler üzerinde kontrol hakkına, tüzük belirleme hakkına ve kapama hakkına sahiptirler.

[4] Balina: Finans sektöründe elinde piyasayı manipüle edebilecek kadar kapital bulunduran oyunculara balina denmektedir. Balinalar ellerindeki kapitaller ile piyasaları domine edebilirler.

[5] “Volume of data/information created, captured, copied, and consumed worldwide from 2010 to 2025(in zettabyts)”, değiştirilme tarihi 23 Mayıs 2022, https://www.statista.com/statistics/871513/worldwide-data-created/

[6] Dr. Öğr. Üyesi Sebetci Özel, Öğr. Gör. Aslıhan Topal, Öğr. Gör. Mehmet Can Hanaylı, Öğr. Gör. Gizem Gürek Dönük. “DİJİTAL ORTAMDA KİŞİSEL VERİ GÜVENLİĞİ VE SOSYAL MEDYA REKLAMCILIĞI ÜZERİNE BİR DEĞERLENDİRME” . Kesit Akademi Dergisi 4/16. s. 389-409. (2018)

Kaynakça:

1.      Muhammet Özcan. “Sosyal Medya  Platformlarının Hisse Senedi Piyasalarına Etkisi: BIST 30 Örneği”. Gümüşhane Üniversitesi Sosyal Bilimler Enstitüsü Elektronik Dergisi. 12(1). 160-172. (2021)

2.      Uhr Patrick,  Johannes Zenkert,  Madjid Fathi. “SENTIMENT ANALYSIS IN FINANCIAL MARKETS A Framework to utilize the Human Ability  of Word Association for analyzing Stock Market News Reports”. University of Siegen Institute of Knowledge Based Systems, Germany. (2014)

3.      László Nemes & Attila Kiss. “Prediction of stock values changes using sentiment analysis of stock news headlines”, Journal of Information and Telecommunication. 5:3, 375-394.(2021)

4.      Gondaliya Chetan, Ajay Patel, Tirthank Shah. “Sentiment analysis and prediction of Indian stock market amid Covid-19 pandemic”. IOP Conf. Ser.: Mater. Sci. Eng. 1020 012023. (2021)

5.      Geetha Angelina, Shri Bharathi. SV. “Sentiment Analysis  for Effective Stock Market Prediction”.International Journal of Intelligent Engineering and Systems. (2017)

6.      Akgül Eyüp Sercan, Caner Ertano,  Banu Diri. “ Twitter verile ile duygu analizi”. Pamukkale Univ Muh Bilim Derg, 22(2), 106-110. (2016)

7.      Albayrak Mehmet, Kamil Topal, Volkan Altıntaş. “Sosyal Medya Üzerinde Veri Analizi: Twitter”. Süleyman Demirel Üniversitesi İktisadi ve İdari Bilinler Fakültesi Dergisi C.22, Kayfor 15 Özel Sayı, s. 1991,1998. (2017)

8.      “Volume of data/information created, captured, copied, and consumed worldwide from 2010 to 2025(in zettabyts)”, Değiştirilme tarihi 23 Mayıs 2022, https://www.statista.com/statistics/871513/worldwide-data-created/

9.      Dr. Öğr. Üyesi Sebetci Özel, Öğr. Gör. Aslıhan Topal, Öğr. Gör. Mehmet Can Hanaylı, Öğr. Gör. Gizem Gürek Dönük. “DİJİTAL ORTAMDA KİŞİSEL VERİ GÜVENLİĞİ VE SOSYAL MEDYA REKLAMCILIĞI ÜZERİNE BİR DEĞERLENDİRME” . Kesit Akademi Dergisi 4/16. s. 389-409. (2018)

Exit mobile version