View on GitHub

thirdwave

Bol Veri

Bir yazimizda soyle demisiz:

“Girdigimiz bilgi caginda ham veri, kapidan, bacadan, agzinizdan, kulaginizdan iceri giriyor olacak, o kadar fazla olacak ki “nasil bulacagim?” diye dusunmeyeceksiniz bile. Bu noktadan sonra veriyi analiz edebilecek insanlar ve araclara ihtiyac had safhada olacaktir; Temel bilimler bu alanlardan sadece bir tanesidir…”

Ham veri hakkinda ilginc bazi gelismeler: Amazon EC2 sistemini bilenler vardir. EC2, Web sitelerini barindirmak icin anlasma yapilan servis saglayici sirketinin yapisina benziyor. Fakat istediginiz kapasitede bir “sanal bilgisayari” bir kac komutla dinamik olarak yaratiyorsunuz (Amazon altyapisi bunun hangi fiziki bilgisayara tekabul ettigini ayarliyor, belki ellerinde birkac dev gibi bilgisayar ya da koca bir kume var, o kullanici icin onemli degil) ve bu bilgisayara uzaktan aninda baglanip is yapabilmeye basliyorsunuz. Hemen kullanilip (istenirse atilabilen) islem gucune sahip olup, bunun karsiliginda bir kira odeyebiliyorsunuz. Bu bir.

Iki: Amazon EC2’de yeni bir servis baslatti: Bu servis kullanilmak uzere hazir, onceden pisirilmis bazi veri kaynaklarini acik olarak paylasmak. Acik veri obeklerine EC2’deki programlar aninda baglanip onlar uzerinde islem yapmaya baslayabiliyor. Bu girisimciler icin bir firsat: Veri setlerini analiz ederek son kullaniciya bazi hizmetler sunulabilir. Veri setleri arasinda simdilik Insan Genomu biyolojik verisi, ekonomik veriler gibi kaynaklar bulunuyor. Son kullanicilar basvurup onemli gordukleri verileri EC2 uzerinden yayinlattirabiliyorlar.

Bir “veri bollogu” donemine giriyoruz; bu donemde bol analist, modelleyici, isleyici, informasyon teknolojisi uzmani gibi kisiliklere ihtiyacimiz var.