İSTATİSTİK NEDİR?

İstatistik sözcüğü değişik anlamlarda kullanılan ve bunun bir sonucu olarak da farklı tanımları olan bir kavramdır.

İstatistiğin birinci anlamı, belli konularda toplanan sayısal değerler ile ileri sürülen bir takım şekillerdir. Örneğin, bir ülkenin toplam nüfusu, ilköğretim, ortaöğretim veya yüksek öğretimdeki öğrenci ve öğretmen sayısı, üniversitelerde öğrenci başına düşen öğretim üyesi sayısı, okuma-yazma oranı, hizmet sektöründe çalışan nüfus oranı, dışalım (ithalat) ve dışsatım (ihracat) ile ilgili değerler, üretilen otomobil, televizyon veya traktör sayılarını vb. ifade eden değerler, şekil ve grafikler istatistik olarak adlandırılmaktadır.

İkinci olarak, birçok farklı alanda ortaya çıkan soruları ve/veya sorunları yanıtlamak için yapılan araştırmalarda temel unsur olan verileri doğru bir şekilde toplayarak analiz ederek bazı anlamlı bilgilere ulaşma işlemini “istatistik yöntemler” veya kısaca “istatistik” olarak tanımlayabiliriz. Söz konusu amaca ulaşmak için, istatistikte:

  • Deneme desenlerinin planlanması veya tasarım,
  • Verilerin toplanması,
  • Verilerin özetlenmesi ve analizi,
  • Sonuçların yorumlanması ve genelleştirilmesi

ile ilgili yöntemler ve prensiplerden yararlanılır.

İstatistiğin üçüncü tanımı üzerinde çalışılan bir populasyondan şansa bağlı olarak seçilen örneklerden hesaplanan ortalama ve standart sapma gibi çeşitli değerlerdir. Bu anlamıyla istatistik, üzerinde çalışılan bir populasyonu tanımak için istatistik yöntemler ve analizler ile elde edilen ve populasyona özgü değerleri (parametreler) tahmin etmek için kullandığımız değerlerdir.

İSTATİSTİĞİN TARİHÇESİ

İstatistik sözcüğünün kullanılması Aristotle zamanlarına kadar gitmektedir. Bu tarihlerde devletler toplam askeri ve mali güçlerini saptayabilmek için bazı sayımlar yapmışlardır. 17. YY’ın başına kadar istatistikte fazlaca bir gelişme görülmemiştir. Toplanan verilerin istatistik analizlerine doğru ilk adım 17. YY’da İngiltere’de John Graunt tarafından atılmıştır. “Politik Aritmetik” denilen hayat istatistikleri, sigorta ve ekonomik istatistikleri kapsayan bu konuda, aynı YY’da William Petty (1623-1687) tarafından kitap da (Political Aritmetick or A Discourse, 1690) yazılmıştır.

Günümüzdeki anlamı ile ilk modern istatistiğin gelişmesindeki en büyük etmenlerden biri de 16. ve 17. YY’larda olasılık teorisinin ilgi çekmesi ve bazı bilim adamlarının bu konuda çalışmaya başlaması olmuştur. Olasılığın literatüre geçmiş ilk uygulamalarından biri Galile tarafından yapılmış olup şans oyunlarına yöneliktir. Daha sonraları ünlü matematikçilerden Pascal, Fermat, James ve Daniel Bernoulli, de Moivre, Laplace, Gauss, Simpson, Lagrange, Hermite ve Legendre birçok önemli olasılık kurallarını ve teoremlerini geliştirerek istatitiğin gelişmesine önemli katkılarda bulunmuşlardır.

19. YY’ın sonlarına doğru bir bireyde birden fazla değişken ölçüldüğünde regresyon ve korelasyon kavramı Sir Francis Galton tarafından geliştirilmiştir. Daha sonra Galton’un bu fikirleri Karl Pearson ve C. Sperman tarafından genişletilerek psikoloji ve sosyal bilimlere uygulanmıştır.

1908 yılında Biometrika dergisinde yayınladığı bir makale ile William S. Gosset istatistikte yeni bir dönemin başlamasına yol açmıştır. Bir bira fabrikasında arpa ıslahı projelerinde çalışan Gosset, ekonomik nedenlerle küçük örneklerle uğraşmak zorunluluğunda kalmış olup az sayıdaki gözlemlere uygun istatistiki yöntemlere gereksinim duymuştur. Böyle bir gereksinimden hareketle, küçük örneklerin dağılışını deneysel olarak inceleyen Gosset günümüzde çok yaygın olarak kullanılan bazı yöntemleri geliştirmiş, pek çoğuna da ışık tutmuştur. Yazılarını “Student” takma adıyla yayınlayan Gosset’ten sonra Ronald A. Fisher küçük örnek teorisini geliştirerek günlük araştırmalarda uygulanmasını sağlamıştır.

20. YY’ın en büyük istatistikçisi olarak tanımlayabileceğimiz Sir Ronald A. Fisher günümüzde kullanılan istatistik yöntemlerin hemen hemen hepsinin ilk fikirlerini ortaya atan ve en yaygın olarak kullanılan pek çok yöntemi de geliştiren kişidir.

İstatistik teorisinin gelişmesinde Karl Pearson’nun oğlu E.S. Pearson ve J. Neyman’ın da büyük katkıları olmuştur.

İSTATİSTİĞİN UYGULAMA ALANLARI

Günümüzde istatistik çalışmaya başvurulmayan herhangi bir alan yok gibidir. Gerçekten de tarım, tıp, endüstri, ekonomi, çevre bilimlerinden kalite kontrolüne kadar hemen her alanda ortaya çıkan sorunların çözümünde istatistikten geniş ölçüde yararlanılmaktadır. Bugün, endüstriyel ve ticari faaliyetler ve hatta hükümetlerin karar verme süreçlerinde toplanan ve gözlenen verilerden anlamlı bilginin üretilmesi veya çıkarılması istatistik yöntemlerin kullanılmasını zorunlu kılmaktadır.

Özellikle, çeşitli bilimsel ve uygulamalı alanlarda hemen her ölçekte araştırma ve geliştirme çalışmaları yürüten bilim adamları, araştırıcılar ve yöneticilerin istatistik teknik ve yöntemlerini belirli ölçüde bilmek ve tanımak zorundadır.

Son yıllarda, istatistik yöntemlerin kullanılması o kadar gelişmiş ve genişlemiştir ki, uygulamalı istatistiğin (applied statistics) birçok çeşitli alan için özelleşmiş alt disiplinleri ortaya çıkmıştır. Örneğin, biyoloji, tıp ve ziraat gibi biyolojik bilimler için biyometri (biometry) veya biyostatistik (biological statistics); çevre bilimleri için çevresel istatistik (environmetry); jeoloji ve maden mühendisliği için geometri (geometry); ekonomi bilimleri için ekonometri (econometry), psikoloji bilimi için psikometri (pyscometry) bunlar arasında sayılabilecek başlıcalarıdır.

İSTATİSTİĞİN KONULARI

İstatistik yöntemler veya işlemler temel olarak iki kategoriye ayrılarak gruplandırılabilir.

Tanımlayıcı İstatistik Yöntemler

Tanımlayıcı istatistik veya açıklayıcı istatistik (descriptive statistics), gözlem değerleri üzerinde yapılan ilk istatistiklerdir. Frekans dağılışı ve ortalama, dağılış ölçüleri ve değişkenler arasındaki göreli ve potensiyel ilişkiler gibi istatistiklerin hesaplanması ve parametrelerin tahminlenmesini konu edinmektedir.

Değişkenlerin tek olarak analiz edilmesi işlemi olan tek değişkenli (univariate) istatistikte değişkene ait dağılışın şekli, merkezi, serpilimi ve göreli pozisyonu saptanırken iki değişken arasındaki ilişkileri konu edinen iki değişkenli istatistikte değişkenler arasındaki korelasyon ve regresyonlar tahmin edilirler. Çok değişkenli istatistikte ise değişkenler arasındaki çoklu regresyonlar hesaplanır.

Bir iş yerinde çalışan kişilerin ortalama ücreti, istatistik dersini almakta olan öğrencilerin ortalama notu vb. istatistikler açıklayıcı istatistiklere örnek verilebilir.

Yorumsal İstatistik Yöntemler

Yorumsal istatistik (inferential statistics) veya genelleştirme istatistiği (inductive statistics), sayma, sorgulama ve şansa bağlı olarak yapılan örneklemeler aracılığıyla çalışılan populasyon hakkında mümkün olduğunca fazla bilgi edinmeyi konu edinir. Bu aşamada, elde edilen ortalamalar kullanılarak iki ortalamanın testi (t-testi) ve çoklu ortalamaların testi (varyans analizi) gibi yapılır.

“İstatistik dersini alan öğrencilerin notları %95 güvenilirlikle 35 ile 86 arasındadır” örneği yorumsal istatistiğe bir örnek olarak verilebilir.

Yorumsal istatistikte iki temel yöntem kullanılır. Bunlar tahminleme ve hipotez testidir. Tahminlemede, populasyondan çekilen örneklerden populasyona ait parametreleri tahmin etmek ve oluşturulan tahminler hakkında güven aralığı vermek söz konusudur. Hipotez testininin en yaygın kullanımında bir sıfır hipotez ileri sürülür ve verinin bunu red etmek için yeterince güçlü olup olmadığı belirlenir.

* Bu bölüm, http://alfa.cu.edu.tr/ adresinden alınmıştır.