Büyük Veri, Büyük Efsane

İş çevrelerinde bugünlerin en moda söylemlerinden birisi de büyük veri. İş dergileri her sayısında bu konuyla ilgili makaleler yayınlıyor. Her şirketin sahip olduğu veriyi mutlaka işlemesi gerektiği fikri pazarlanıyor. Şirketlerin büyük veriyi doğru işleyerek büyüyebilecekleri ve karlılıklarını artıracakları anlatılıyor. 

Peki, büyük veri nedir? Bir şirket veya bir kurum elindeki hangi bilgilerden yararlanabilir?

Bir insan bir mağazadan ya da e ticaret sitesinden alışveriş yaptığında arkasında bir iz bırakır: Ne aldığı ne kadar aldığı ne zaman aldığı ne kadar para ödediği gibi. Benzer şekilde satış sonrası veya teknik servisten yararlandığında da bir iz bırakır ya da sosyal mecra hesaplarından etkileşime geçebilir. Sadece bunlar değil söz konusu markayla etkileşime giren insanların izlenebilen bütün davranışlarının kayıtları o şirketin büyük verisini oluşturur. On binlerce (hatta büyük şirketler için milyonlarca) insanın davranışlarının kaydından oluşan büyük veri iyi incelense teorik olarak şirketler bu analizden çok şey öğrenir ve satışlarını artırabilirler.

Danışmanların verdiği bir örnek vardır. Bir süper marketin kasa fişlerini analiz ettiklerinde bebek bezi satışlarıyla bira satışları arasında bir ilişki (korelasyon) olduğunu saptamışlar. Bunun nedenini araştırdıklarında yeni doğum yapmış kadınların eşlerini bebek bezi satın almaya gönderdiklerinde erkeklerin alışveriş sırasında kendilerine de bira satın aldıklarını keşfetmişler. Sonra da bu bilgiyi pazarlama faaliyetlerinde kullanmışlar.

Uluslararası danışmanlık kuruluşları şirketlere büyük veri danışmanlığı projeleri pazarlarken buna benzer örnekler kullanır ve şirketin elindeki büyük veriden tüketici veya müşterileri için hazine değerinde bilgiler (iç görüler) elde edebileceklerini vaat ederler.

Bütün bu anlatılanlar teorik olarak mümkün görünse de gerçek hayat anlatılandan farklıdır. Ünlü beyzbolcu Yogi Berra’nın dediği gibi, “Teoride, teori ile pratik arasında fark yoktur ama pratikte vardır.”

Büyük veri analizi mükemmel bir vaattir ama pratikte büyük verinin bu vaadi yerine getirmesinin önünde iki büyük engel vardır. Her şeyden önce her büyük veri aslında var olmayan birçok ilişki ortaya çıkarır. Bu sanal ilişkiler her büyük verinin içinde bulunan tesadüfi ilişkilerdir (The Randomness of Correlation ). Ayrıca birçok ilişkinin aslında hiç bir anlamı yoktur .Tyler Vigen 2000 ile 2009 yılları arasında Maine eyaletinde boşanma sayılarıyla margarin tüketimi arasında mükemmel bir ilişki olduğunu ispat etti. İstatistiki olarak ilişki çok güçlüydü ama hiç bir anlamı yoktu. İstatistikte iki değişken arasında bir ilişki olduğunu saptamak, bir değişkenin diğerinin oluşmasına neden olduğu anlamına gelmez (Spurious Correlations).

Büyük verinin vaat ettiğiyle gerçek hayatta şirketlere sağladığı katkının farklı olması, büyük verinin -doğası gereği- içinde gereksiz pek çok “çöpü” barındırmasından kaynaklanır.  

Nassim Taleb ’in dediği gibi “Büyük veri, samanlıkta iğne aramak gibidir. Asıl sorun ise aranan iğnenin her seferinde daha fazla samanla birlikte gelmesidir.” 

Büyük şirket yöneticileri bu bilgilere sahip olmadan uluslararası danışmanlık şirketlerinden büyük veriyi nasıl işleyecekleri konusunda danışmanlık alıyorlar. Büyük veriyi işlemek için yeni bilgisayar donanımı ve yazılımı satın alıyorlar. Büyük veriye büyük umutlar bağlıyorlar. Artan rekabete ve eriyen kârlara çarenin büyük veriyi analiz etmek olduğuna inanıyorlar. Büyük veri gözlerini kamaştırıyor. 

Ama büyük veri -adı üzerinde- verinin çok olması demektir; iyi olması değil. Çok veriye sahip olmak hatta bunu çok iyi analiz etmek doğru karar almanın garantisi değildir.

Bugün itibariyle büyük veri bir işyeri efsanesi olarak büyük şirketlerin gündeminin ilk sıralarında yer alıyor. Büyük veri teorisi hakkında konuşan pek çok danışman ve yönetici var. 

Jerry Daykin’in dediği gibi büyük veri hakkında söylenenler ergenlik çağındaki çocukların cinsellikle ilgili hikayelerine benziyor. Yöneticiler büyük veri diye bir şeyden bahsediyor ama gerçekte büyük veriyi analiz edip hayata geçirmiş ve başarılı sonuçlar almış bir şirket henüz ortada yok.

Yorumlar

  1. Yazınızın başlığı da konuyu anlamak için yeterli. Hani klişe bir deyim vardır ; “hislerime tercüman oldunuz” diye. Aynen tekrarlıyorum. Tebrikler.

  2. Ülkemizde de en büyük problem zamanla neden alındığı bilinmeyen çöp veriler ve bu verileri işleyip, fikir üretecek eleman kalitesinin olmaması. Hatta eleman yetiştirecek akademisyen bile kısıtlı.

    Yazı için elinize sağlık hocam.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Konuyla İlgili Makale ve Linkler

  1. Nassim Taleb, The Big Errors of Big Data, Farnam Street

    https://fs.blog/2013/02/the-big-errors-of-big-data/
  2. Nassim Taleb, Beware the Big Errors of Big Data, Wired

    https://www.wired.com/2013/02/big-data-means-big-errors-people/
  3. Jerry Daykin, Is This the End of Data? , Linkedin, 8 Eylül 2018

    https://www.linkedin.com/pulse/end-data-digital-marketing-digitalsense-jerry-daykin