Hesaplamalı Sosyal Bilim Nedir?
Hesaplamalı sosyal bilim, sosyal bilimlerin odağı olan insanı ve insanların yaşadıkları problemleri hesaplamalı bilimlerden gelen yöntemlerle çözme yaklaşımıdır. Günümüzde dijitalleşme ile belirli bir anda erişilebilen bilgi miktarı çok hızlı bir şekilde artmaktadır. Bu bilgilerin daha büyük bir kısmı dijital olarak saklanmakta ve işlenmektedir. Dijital çağın getirdiği bu yoğun dijital içerik sayesinde hesaplamalı sosyal bilimler büyük veri gibi birçok imkânı kullanarak sosyal bilimlerdeki birçok konuyu anlamamız için yeni imkânlar sunmaktadır. Bilimsel çalışmaların özünde yatan iki temel unsur mevcut durumu anlamak ve geleceğe dair tahmin yürütmektir.
Hesaplamalı sosyal bilim, hesaplamalı yöntemleri kullanarak sosyal bilimlerdeki sorunları anlamlandırmaya çalışır. Büyük verileri ele almak, kodları sıralamak, diğer disiplinlerden analitik yöntemler uygulamak hesaplamalı sosyal bilim kullanmaya örnek olarak verilebilir. Örneğin, sosyal ağların haritaları, insanlarla konuşarak ve onlara ağlarında kimlerin olduğu ve en çok kimlerle konuştukları sorularak çıkarılabilir. Ya da böyle bir haritaya bir sosyal ağ sitesinden büyük miktarlarda veri kazıyarak ve insanların bu sitede ne kadar etkileşimde bulunduğunu gösteren grafikler oluşturularak da ulaşılabilir.[1]
Hesaplamalı sosyal bilimin bazı avantajları bulunmaktadır. Bilinen veri evreni hızla genişlemekte, günlük hayatımızın geniş bir alanı, sosyal etkileşimlerimiz, faaliyetlerimiz ve davranışlarımız dijital olarak kaydedilmektedir. Eğer kaydedilen tüm bu bilgiler kullanılabilir, derlenebilir ve bu kaynaklar sosyal bilim çerçevesinde ele alınıp web siteleri, belgeler, kayıtlar, resimler, metinler, algoritmalar gibi kaynaklara aktarılabilirse, son derece ilginç bir bilgi kaynağı elde edilebilir. [2]
Hesaplamalı Sosyal Bilimler İçin Örnek Çalışma Veri Türleri [3]
Hesaplamalı sosyal bilim ve dijital teknikler, diğer tekniklerin yerini almanın aksine onları tamamlarlar. Örneğin bir doktor röntgen makinesi edindiğinde, röntgen makinesi doktorun hedeflerini değiştirmez. Doktorun amacı hâlâ iyileşmemize yardımcı olmaktır; röntgen makinesi ise bu hedeflere ulaşmak için kullandığı işini daha etkin yapmasını sağlayan bir başka araçtır. Hesaplamalı sosyal bilimler de benzer bir biçimde bu hedeflere daha hızlı ulaşmaya yardımcı olan bir araçtır.
Bu alan tabiatı itibarıyla disiplinler arası olduğu için hesaplamalı sosyal bilimler topluluğu oluşturularak ortak çalışmalar yapılması gerekmektedir. Bunun oluşturulması için veri bilimciler ve sosyal bilimcilerin öğrenecekleri ve her bir grubun birbirine katkı sağlayabilecekleri şeyler olduğunu fark etmeleri sağlanabilir. Peki, veri bilimi nedir? David Donoho, 50 Yıllık Veri Bilimi başlıklı çalışmasında [4] veri bilimcileri, temelde veriden bilgi edinmeye odaklanmış insanlar olarak tanımlar. Veriden bilgi edinmek, istatistiği, bilgisayar biliminin belirli bölümlerini, diğer mühendislik alanlarının belirli bölümlerini ve şu anda üniversitelerde gerçekleşmeyen belirli süreçleri içerir. Dolayısıyla, sosyal bilimcilerin ve veri bilimcilerin birbirlerinden öğrenmeleri ve ayrıca birbirlerine öğretmeleri fikri, hesaplamalı sosyal bilimler dâhilinde bu topluluğun büyümesi için faydalı bir yol olacaktır. Aynı şekilde, yeni dijital çağın veri kaynaklarından yararlanmak istiyorsanız sosyal bilim tek başına yeterli değildir. Dolayısıyla, hesaplamalı sosyal bilimlerin gelişebilmesi aslında ancak bu toplulukların bir araya gelmesiyle mümkün olabilir. Farklı disiplinlerden gelen insanlarla iletişim kurmaya başladığınız zaman, insanların beklentileri arasında uyumsuzluklar olduğunu ya da birine iyi, önemli ve ilginç gelen bir araştırma konusunun başka biri için aynı şeyi ifade etmediğini görebilirsiniz.
Hanna Wallach insanları bilgisayar bilimi topluluğu ve sosyal bilimler topluluğu olarak iki geniş gruba ayırır ve bu alanlardaki araştırma türlerini kabaca özetler. Bilgisayar bilimciler hemen her şeyi araştırabilirler, yaptıkları iş çoğunlukla yöntem odaklıdır, genellikle büyük veri kümelerini kullanırlar ve odak noktası genelde tahmindir. Sosyal bilim ise genellikle toplumsal konuları araştırır. Soru odaklı olan bu süreçte, sorular uzun bir araştırma geleneğinden gelir. Genellikle küçük tasarım verileri kullanılır ve açıklamaya odaklanılır.
Bilgisayar Bilimi Topluluğu | Sosyal Bilim Topluluğu |
Her şeyi araştırır | Toplumsal konuları araştırır |
Yöntem odaklıdır | Soru odaklıdır |
Büyük veri kümelerini kullanır | Küçük veri kümelerini kullanır. |
Tahmin odaklıdır | Açıklama odaklıdır |
Yani kendinizi sosyal bilimcileri ve veri bilimcileri, hatta kendi içinde farklı sosyal bilimcileri bir araya getiren bir toplulukta bulursanız, diğer insanların ne yaptığını, yaptıkları şeyleri yaptıklarını neden anlamadığınızı ya da nasıl yanlış anladığınızı görebilirsiniz. Buradaki kilit nokta, toplulukların birbirine sunacağı yeni öğretiler ve bakış açılarıdır. Gelecekte yapılacak en sıra dışı araştırmalar, sosyal bilim ve bilgisayar biliminin birleşimiyle mümkün olacaktır.
Hesaplamalı sosyal bilimde kullanılan hazır-yapım ve özel amaçlı veri türünü bir çalışma ile açıklamak gerekirse; Joshua Blumenstock ve meslektaşları [5] tarafından 2015’te Science dergisinde yayınlanmış bir makale, dünyada yoksulluk çalışmalarında yaşanan problemlere yeni bir bakış açısı sunmuştur. Bu problemlerden biri, nerede, ne kadar yoksulluğun olduğunu ve zaman içerisinde bunun nasıl bir değişim gösterdiğini bilmenin zor olmasıydı. Zengin ülkelerdeki insanların çoğu, bu verileri düzenli ve sürekli olarak toplayan yüksek kaliteli ulusal istatistik sistemleri olmasına alışıktır. Ancak, dünyanın en yoksul ülkelerinin birçoğunda, yani bu bilgiye ihtiyacın en çok duyulduğu yerlerde, genellikle böyle bir sistem yoktur. Blumenstock ve meslektaşlarının yapmaya çalıştığı şey ise, gelişmekte olan ülkelerdeki yoksulluk ve refah miktarını ölçmek için cep telefonu üst verilerini (metadata) kullanarak daha iyi yöntemler bulup bulamayacaklarını görmekti. Çalışmaya bir sürü arama kaydıyla başlarlar. Bu kayıtlar, Ruanda’nın en büyük telefon şirketinin 1,5 milyon müşterisine ait telefon görüşmelerinin kayıtlarıdır. Giden aramaların kayıtlarına, gelen aramaların kayıtlarına, görüşmelerin nerede gerçekleştiğine, baz istasyonuna erişimleri vardır. Yani görüşmelerin içeriğine erişimleri bulunmazken görüşmelerin üst verilerine (metadata) erişimi bulunur. Bu kayıtlar, bahsi geçen 1,5 milyon müşteri hakkında birçok bilgi saptar ama tam olarak bir yoksulluk ve zenginlik ölçüsü vermez.
Araştırmacılar bu insanlardan rastgele bir örneklem alıp ararlar ve gelişmekte olan ülkelerdeki yoksulluğu ölçmek için tasarlanmış geleneksel bir sosyal bilim anketi uygularlar. Yani bu şekilde, iki çok farklı veri türünü alıp beraber kullanırlar. Önce her aramanın bir satırda bulunduğu bu arama kayıtlarını, her kişi için bir satır ve her özellik için bir sütun olacak şekilde dönüştürdükleri, özellik mühendisliği dediğimiz bir işlemden geçirirler. Bu sütunlardaki özellikler giden arama sayısı ya da gelen arama sayısı olabileceği gibi aynı zamanda aradığınız insanlar içinde birbirlerini arayanların yüzdesi gibi karmaşık bir şey de olabilir. Her bir satırın bir kişiyi ve her bir sütunun bir özelliği temsil ettiği büyük bir matris oluşturduktan sonra, artık bu iki şeyi birbirine bağlamak için bir makine öğrenimi modeli yaratılabilir hâle gelir. Bu modeli, telefon görüşmelerindeki davranışlarınıza göre bu ankette yoksulluk ya da refah seviyenizle ilgili nasıl yanıtlar vereceğinizi tahmin edecek şekilde inşa ederler. Modeli inşa ettikten sonra artık diğer tüm müşterilerin anket yanıtlarına yaklaşık değerler vermek için kullanabilirler. Böylece, yaklaşık bin kişiye anket uygulayarak kalan yaklaşık 1,5 milyon kişinin anket yanıtlarını varsaymaları ya da tahmin etmeleri mümkün olur. Ardından, herkesin ikamet yerini de çıkarabilirler. Bunu kabaca, geceleri telefon görüşmelerini nerede yaptıklarına bakarak yaparlar. Yani, aslında yaptıkları şey daha karmaşıkken ana fikri bu eyleme dayanır. Bu noktada, verileri tahmini varlık ve tahmini ikamet noktalarıyla birleştirip yüksek çözünürlüklü yoksulluk haritaları çıkarabilir hâle gelirler.
Bu çalışmada yapıldığı gibi iki tarzı birleştirme fikrini hesaplamalı sosyal bilimlerde giderek daha sık görüyor olacağız. Telefon görüşmelerine ait veriler ve telefon kayıtları tek başına yeterli olmadığı gibi ve anket verileri de tek başına yeterli değildi. Bu yüksek çözünürlüklü yoksulluk tahminlerini ancak ikisini birleştirerek yapabilirlerdi. Sanırım bu saf yaklaşımların her birinin bir noktada sınırlı kalacağını giderek daha net bir şekilde göreceğiz. Hazır-yapım yaklaşımı ile araştırma için oluşturulmamış verileri başka bir amaca uygun hâle getirerek öğrenebileceklerimiz sınırlıdır. Aynı şekilde, özel amaçlı verilerle çalışmaya alışkın araştırmacılar için de dünyada var olan tüm hazır-yapım verileri görmezden gelmek giderek zorlaşacaktır. Amacımız sosyal dünyayla ilgili olabildiğince hızlı ve doğru bir şekilde bilgi edinmekse var olan tüm hazır verileri görmezden gelmek akıllıca bir adım olmayacaktır. Bundan beş ya da on yıl sonra var olacak hazır-yapım verilerini düşündüğümüzde her ne kadar istediğimiz kesin ölçüm özelliklerine sahip olmasalar ya da alıştığımız şekilde toplanmasalar da onları görmezden gelemeyeceğiz. Öğrenebildiğimiz kadar çok şey öğrenmek istiyorsak, bu hazır veri kaynaklarından nasıl yararlanacağımızı da öğrenmemiz gerecek. Blumenstock’un çalışmasında gördüğümüz üzere, hazır-yapım ve özel amaçlı verilerin kombinasyonlarıyla daha sık karşılaşacağız.
Hesaplamalı Sosyal Bilim Çalışmalarının Mevcut Durumu
Scopus [6] kayıtlarına göre hesaplamalı sosyal bilim alanında yayınlanmış 744 çalışma bulunmaktadır. Bu alanda en fazla çalışma yapan 5 ülke sırasıyla ABD (373), İngiltere (97), Almanya (85), İtalya (51) ve Çin (47)’dir. Ülkemiz ise 10 çalışma ile bu listede 24. sıradadır (Şekil 1)
Şekil 1. Hesaplamalı sosyal bilimler alanında en fazla yayın yapan ülkeler
Şekil 2’de hesaplamalı sosyal bilimler çalışmalarında en çok kullanılan ilk 5 anahtar kelime olan sosyal ağ (225), davranış araştırması (138), sosyal medya (135), büyük veri (111) ve sosyal bilimler (82) bulunmaktadır.
Şekil 2. Hesaplamalı sosyal bilimler çalışmalarında en çok kullanılan anahtar kelimeler
Bu alana en fazla katkı sağlayan ilk iki kurum ise ABD merkezli NSF- National Science Foundation (75) ve Department of Defense (23)’tür. 21 çalışmaya destek olan European Commission 3. sırada yer alırken 16 yayın desteği ile Horizon 2020 Framework Programme 4. Sırada ve yine ABD merkezli National Institutes of Health 15 yayın ile 5. sıradadır (Şekil 3). Bu veriler hesaplamalı sosyal bilimler alanında ABD ağırlıklı bir yapının olduğunu ortaya koymaktadır. ABD Ordusunun da alana yaptığı yatırımlar göze çarpmaktadır.
Şekil 3. Hesaplamalı sosyal bilimler çalışmalarına en fazla destek sağlayan kurumlar
Sonuç
Bugün dijital verilerimizden oluşan büyük veriyle çalışmak ilgi çekici olabilir ancak amaç çalışma alanı olarak büyük verinin kendisi olmaktan ziyade; insanların yaşadıkları problemlere çözüm bulmasını sağlamak olmalıdır. Dünyayı ve sosyal bilimleri ilgilendiren asıl hedef de problemlere çözüm bulunmasıdır. Büyük veri, hesaplamalı sosyal bilimler ve diğer birçok yaklaşım bu amaca hizmet etmek için var olduğunda anlamlıdır. Bilimsel çalışmaların özünde aslında iki temel unsur bulunmaktadır: mevcut durumu anlamak ve geleceğe dair tahmin yürütmek. Yoğun dijital içeriklerle birlikte eskiden hiç olmadığı kadar veriye sahip olmamız bizlere olaylar arasındaki ilişkilerin ve çözümlerin izini sürmemizde yardımcı olmaktadır.
Ülkemizde güncel problemlerimizin çözümleri için gerekli olan uzun vadeli politikalar için veriye dayalı hesaplamalı sosyal bilim çalışmalarına daha fazla önem verilmelidir. Meselelerin her boyutuna kapsayıcı çözümler üretilmesi için bu çalışmalara tüm bilim alanlarındaki araştırmacılar katkı sunmalıdır. Hesaplamalı sosyal bilim yaklaşımlarına bugün büyük bir ilgi olmakla birlikte bu konuda doğru ve standart veriye erişim gibi aslında çok ciddi zorluklar da bulunmaktadır. Bu zorlukların giderilmesi hem durum tespiti hem de faydalı çözümler için büyük önem arz etmektedir. Hesaplamalı sosyal bilimler ile ilgilenenler için derinlikli bilgiye ulaşmak için Natura tarafından hazırlanmış kapsamlı bir özel sayı bulunmaktadır.[7] Ayrıca 19-22 Temmuz 2022 tarihleri arasında Chicago’da 8.’si düzenlenecek bir hesaplamalı sosyal bilim konferans serisi de bu konuda anlamlı bilgiler sunacak düzeydedir.[8]
[1] D. Watts, Computational Social Science: Progress & Future Challenges, (08 Aralık 2016). Erişim: 27 Mayıs 2022. [Çevrimiçi Video]. Erişim adresi: https://www.youtube.com/watch?v=gykNdC2CLVg
[2] UK Data Service, Becoming a Computational Social Scientist, (20 Mayıs 2020). Erişim: 27 Mayıs 2022. [Çevrimiçi Video]. Erişim adresi: https://www.youtube.com/watch?v=p5I5GGHJRPs
[3] Bu bölüm Matthew Salganik’in konuşmasından derlenmiştir. (Matthew Salganik, An Introduction to Computational Social Science, (28 Mayıs 2020). Erişim: 27 Mayıs 2022. [Çevrimiçi Video]. Erişim adresi: https://www.youtube.com/watch?v=zGG9wPl1C5E
[4] D. Donoho, “50 Years of Data Science”, Journal of Computational and Graphical Statistics, c. 26, sy 4, ss. 745-766, Eki. 2017, doi: 10.1080/10618600.2017.1384734.
[5] J. Blumenstock, G. Cadamuro, ve R. On, “Predicting poverty and wealth from mobile phone metadata”, Science, c. 350, sy 6264, ss. 1073-1076, Kas. 2015, doi: 10.1126/science.aac4420.
[6] “Scopus – Document search”, 2022. https://www-scopus-com.proxy.lib.duke.edu/search/form.uri?display=basic#basic (erişim 27 Mayıs 2022).
[7] “Nature speaicl colection for Computational social science”, Nature. https://www.nature.com/collections/cadaddgige (erişim 27 Mayıs 2022).
[8] “8th International Conference on Computational Social Science”, ic2s2. https://boothuchicagocaai.wixsite.com/website-2 (erişim 27 Mayıs 2022).