Arama

İstatistik

Güncelleme: 11 Mayıs 2018 Gösterim: 19.887 Cevap: 3
ThinkerBeLL - avatarı
ThinkerBeLL
VIP VIP Üye
12 Mart 2009       Mesaj #1
ThinkerBeLL - avatarı
VIP VIP Üye
İstatistik
Vikipedi, özgür ansiklopedi
Çan eğrisi gösteren istatistik vergi tahakkuku standart testinde kullanılır.
Sponsorlu Bağlantılar
normaldistributionandscdl6

İstatistik, belirli bir amaç için veri toplama, tablo ve grafiklerle özetleme, sonuçları yorumlama, sonuçların güven derecelerini açıklama, örneklerden elde edilen sonuçları kitle için genelleme, özellikler arasındaki ilişkiyi araştırma, çeşitli konularda geleceğe ilişkin tahmin yapma, deney düzenleme ve gözlem ilkelerini kapsayan bir bilimdir. Fizik ve doğa bilimlerinden sosyal bilimlere kadar geniş bir alanda uygulanabilmektedir. Aynı zamanda iş dünyası ve hükûmetle ilişkili tüm alanlarda karar almak amacıyla kullanılır. İstatistik yukarıdaki anlamıyla tekildir. Sözcüğün çoğul anlamı, "sistemli bir şekilde toplanan sayısal bilgiler"dir. Örnek olarak nüfus istatistikleri, çevre istatistikleri, spor istatistikleri, milli eğitim istatistikleri verilebilir.
İstatistiksel yöntemler, toplanmış verilerin özetlenmesi veya açıklanması amacıyla kullanılır. Bu tür bir yaklaşım betimleyici istatistik adını alır. Buna ek olarak verilerdeki örtüşmelerin (kalıplar veya örüntüler), gözlemlerdeki rassallığı ve belirsizliği göze alacak şekilde, üzerinde çalışılan anakütle veya süreç hakkında sonuç çıkarma amacıyla modellenmesi, sonuç çıkarıcı istatistik adını alır. Hem betimleyici istatistik hem de tahminsel istatistik, uygulamalı istatistiğin parçaları olarak sayılabilir. Matematiksel istatistik adı verilen disiplin ise konunun teorik matematiksel altyapısını inceleyen disiplindir.
İstatistiğin diğer bölümlerle olan ilişkilerinden doğan kavramlar şu şekilde gösterilebilir:
  • Ekonomi+İstatistik = Ekonometri
  • Psikoloji+İstatistik = Psikometri
  • Tıp+İstatistik = Biyoistatistik
  • Sosyoloji+İstatistik = Sosyometri
  • Tarih+İstatistik=Kliometri
Tarihi

Etimolojisi
İstatistik kelimesi Modern Latincedeki statisticum collegium (devlet konseyi) ve İtalyancadaki statista (devlet adamı, politikacı) kelimelerinden türemiştir. Kelime ilk olarak Almanca'da Gottfried Achenwall tarafından devlete ait verilerin sunulduğu Statistik (1749) adlı eserde devlet bilimi anlamında kullanılmıştır. Bu tanımı içeren İngilizce terim ise o dönemde political arithmetic (siyasi aritmetik) olarak geçmekteydi. İstatistik kelimesi veri toplama ve sınıflandırma anlamını ise yaklaşık olarak 19. yüzyılın başlarında kazandı. Terim İngilizce'ye Sir John Sinclair tarafından aktarıldı.
Statistik adlı eserin temel amacı hükümet tarafından ve yönetimsel organlar tarafından kullanılacak veriler sunmaktı. Eyaletler, ve yerel bölgeler hakkında bilgi toplama işi ulusal ve uluslararası istatistik kurumları tarafından sürdürülmektedir. Daha dar anlamda nüfus hakkında düzenli bilgiler ise nüfus sayımları ile elde edilir.
20. yüzyıl boyunca kamu sağlığı ile ilgili konularda (epidemiyoloji, biyoistatistik), ekonomik ve sosyal (işsizlik, ekonometri gibi) alanlarda daha titiz araçlara ihtiyaç duyulması istatistiksel uygulamalarda ilerlemeyi zorunlu kılmıştır. Bu ihtiyaç özellikle 1. Dünya Savaşı sonucu gelişen, nüfusları hakkında derin bilgi sahibi olmak isteyen refah devletlerinde daha belirgin olmuştur. Bu anlamda "toplum yönetimi adına bilgi toplama isteği" filozof Michel Foucault tarafından biyogüç olarak nitelendirilmiştir, bu terim daha sonra pek çok yazar tarafından da kullanılmıştır.

Olasılık Teorisindeki Kökenleri
İstatistiğin matematiksel temelleri Pierre Fermat ve Blaise Pascal'ın 1654 yılına kadar giden Olasılık Teorisi hakkındaki yazışmalarına dayanır. Christiaan Huygens (1657) konunun bilinen ilk bilimsel uygulamasını sunmuştur.
Jakob Bernoulli'nin Ars Conjectandi (posthumous, 1713) ve Abraham de Moivre'nin Doctrine of Chances (1718) adlı eserleri konuya matematiğin bir dalı olarak yaklaşmıştır.
Hata teorisi Roger Cotes'nin Opera Miscellanea (posthumous, 1722) adlı eserine dayanır, fakat teorinin gözlem hatalarına uygulanmasının ilk örneği Thomas Simpson tarafından 1755'te yazılan (basım: 1756) bir bildiride bulunur. Bu bildirinin 1757 yılındaki tekrar basımı pozitif ve negatif hataların eşit derecede olasılıklı olduğu aksiyomunu kabul ederken, bütün hataları içinde bulunduracağını varsayabileceğimiz belirli tanımlanabilir limitlerin varlığından söz ederek "sürekli hatalar"ı ve bir olasılık eğrisini sunar.
Pierre-Simon Laplace , olasılık teorisinin ilkelerine dayanarak gözlem kombinasyonları için bir kural geliştirmeye çalıştı (1774). Hata olasılıkları kanununu bir eğri ile gösterdi.

Kavramsal Bakış
İstatistiğin bilimsel,, endüstriyel veya toplumsal bir probleme uygulanmasında önce üzerinde çalışılan süreç veya anakütle ele alınır. Bu anakütle bir ülkedeki insanların nüfusu, kayadaki kristal miktarı veya belirli bir fabrikanın belirli bir dönemde ürettiği mallar olabilir. Bunun yerine farklı zamanlarda gözlenen bir süreç de olabilir; bu şekilde toplanan veri zaman serisi adını alır.
Pratik nedenlerden ötürü, bütün bir anakütle hakkında veri toplamak yerine genelde anakütleden seçilen bir altküme (örnek veya örneklem) üzerinde çalışılır. Örnek hakkındaki veri deney veya gözlem yoluyla elde edilir. Bundan sonra veri istatistiksel analize tâbi tutulur. Bunun iki amacı vardır; açıklama (betimleme) ve sonuç çıkartma.
  • Betimleyici İstatistik, örneklemi sayısal veya grafiksel olarak özetlemek amacıyla kullanılabilir. Sayısal göstergelere temel örnek olarak ortalama ve standart sapma gösterilebilir. Grafiksel özetler çeşitli türde grafik ve tabloları içerir.
  • Sonuç çıkartıcı istatistik verideki örtüşmeleri modellemek için kullanılır, olasılığı göze alır ve daha büyük bir istatistiksel yığın hakkında sonuç çıkarır. Bu sonuçlar, evet/hayır şeklinde cevaplar olabileceği gibi (hipotez testi), sayısal özelliklerin tahmin edilmesi istatistiksel tahmin gelecekteki değerlerin öngörülmesi istatistiksel öngörü, veriler arasındaki doğrusal ilişkinin yorumlanması (korelasyon), veya bu ilişkilerin modellenmesi (regresyon analizi) şeklinde olur. Diğer belli başlı matematiksel modelleme teknikleri varyanslar analizi ANOVA, zaman serisi, ve veri madenciliğidir.
Burada özellikle korelasyon konusu ele almaya değerdir. Bir veri kümesinin analizi iki değişkenin beraber hareket ettiğini (yani ele alınan ana kütlenin iki özelliğinin benzerlik gösterdiğini) ortaya çıkarabilir. Örneğin yıllık gelirle yaşam süresini ele alan bir çalışma fakir insanların varlıklı insanlardan daha kısa bir yaşam süresine sahip olduğunu bulabilir. Burada gelirle yaşam süresi arasında bir korelasyon olduğu söylenebilir. Fakat buradan asla gelir yaşam süresinin sebebidir veya sonucudur anlamı çıkarılmamalıdır.
Eğer örneklem, anakütleyi temsil etme yeterliliğine sahipse, örnekten elde edilen sonuçlar ve çıkarımlar bir bütün olarak anakütle hakkında bilgi verebilir. Burada asıl problem seçilen örneklemin anakütleyi temsil kabiliyetine sahip olup olmamasıdır. İstatistik, örneklemde ve veri toplama sürecinde ortaya çıkan hataları gideren, örneklemin rassal olmasını sağlayan araçlar sunar. Aynı zamanda güvenilir deneysel sonuçların elde edilmesini sağlayan yöntemler de sunar.
Bu şekilde bir rassallığın anlaşılmasını sağlayan temel matematiksel kavram olasılıktır. Matematiksel İstatistik (İstatistik kuramı), İstatistiğin Matematiksel altyapısını incelemek için Olasılık kuramı ve Matematiksel Analizden faydalanan Uygulamalı Matematik dalıdır.
Herhangi bir istatistiksel yöntem, yalnızca ele alınan anakütle veya sistem yönteminin, matematiksel varsayımlarını sağladığı zaman gecerlidir. İstatistiğin yanlış kullanımı ciddi hatalar doğurabilir. Bu tür hatalar sosyal politikada, tıp uygulamalarında ve yapıların (köprü ve nükleer santral gibi) güvenilirliğinde ciddi etkilere yol açabilir.
İstatistik düzgün şekilde uygulansa bile, sonuçlarının yorumlanması uzman olmayan bir kişi için zor olabilir. Örneğin bir zaman serisinde trendin varlığı apaçık görülmeyebilir, fakat istatistiksel sonuçlar belirgin bir trendin varlığını söyleyebilir. Her gün karşılaşılan bilgiye şüpheyle yaklaşma ve karşılaşılan bilgiyi yorumlama yeteneklerinin tamamı İstatistiksel okuma yazma olarak isimlendirilir.

İstatistiksel Yöntemler

Deneye ve Gözleme Dayalı Çalışmalar
İstatistiksel araştırmaların ortak amaçlarından biri nedenselliği incelemek ve özelde tahmin edicilerdeki veya bağımsız değişkenlerdeki bir değişimin bağımlı değişken üzerindeki etkisini incelemektir. Nedenselliği ele alan temelde iki tür istatistiksel yöntem bulunur: deneysel çalışmalar ve gözleme dayalı çalışmalar. İki çalışma türünde de bağımsız değişken veya değişkenlerdeki farklılıkların gözlenen bağımlı değişken üzerindeki etkisi incelenir. Bu çalışma türlerinde oluşan fark ise yöntemin uygulanma biçimidir. Yöntemlerin ikisi de verimli sonuçlar ortaya koyabilir.
Deneysel yöntemde çalışılan sistem üzerinde bir takım ölçümler yapılır, sistem üzerinde oynamalar yapılır, ve bu oynamaların sistem üzerinde etkisi olup olmadığını anlamak için tekrar ölçüm yapılır. Gözleme dayalı yöntemde ise sisteme müdahale olmaz, bunun yerine veri toplanır ve tahmin edicilerle (bağımsız değişkenler) tepki değişkenleri (bağımlı değişkenler) arasındaki örüntüler araştırılır.
Deneysel çalışmaya örnek olarak Western Elektrik Şirketi'nde aydınlatmanın çalışanlar üzerindeki etkisini araştıran Hawthorne deneyi verilebilir. Deneyde önce santraldeki üretim ölçülmüş, daha sonra kayan bant etrafında çalışan işçilerin aydınlatma koşulları değiştirilmiştir. Bütün deney sonuçları aydınlatmanın verimliliği arttırdığını göstermiştir. Ne var ki bu çalışmanın sonuçları deneysel yöntemdeki hatalar sebebiyle ciddi eleştiriler almıştır. Örneğin çalışmada kontrol grubu kullanılmamıştır.
Gözleme dayalı çalışmaya örnek olarak sigara kullanımı ve akciğer kanseri arasındaki bağınıtıyı inceleyen bir araştırma gösterilebilir. Bu tür çalışmada ilgi alanları hakkında bilgi toplamak için anket yöntemini kullanır ve sonra bilgiler istatistiksel analiz altında incelenir. Bu örnekte araştırmacılar sigara içen ve sigara içmeyen gruplardan bilgi toplar ve her iki gruptaki kanser vakası sayısı ele alınarak karşılaştırılır.
Bir deneyin temel adımları:
1. Araştırmanın planlanması, bilgi kaynaklarının, araştırmanın konusunun belirlenmesi, öne sürülen yöntemdeki ahlaki yönlerin ele alınması.
2. Sistemin modellenmesi, bağımlı ve bağımsız değişkenler arasındaki ilişkiye odaklanma.
3. Bir gözlem grubunu ortak yönlerini ele alacak şekilde özetlemek.
4. Gözlemlediğimiz dünya hakkında sayıların bize neler söylediğini açıklamak.
5. Çalışmanın sonuçlarını belgelemek ve sunmak.
Ölçülme ölçekleri
İstatistik verileri sayılar halinde olup bu sayılar dört çeşit ölçülme ölçeği şeklinde elde edilme olabilirliği vardır. Bu verilerin dört çeşit ölçülme ölceği olabilecegini 1946da Amerikan istatistikci Stanley Stevens ortaya atmıştır. Stevens'in dört ölçulme ölçeği şunlardır: isimsel, sırasal, aralıksal ve oransal. Her bir değişik ölçülme ölçeğine göre elde edilen istatistiksel veriler değişik matematiksel güçte olup her biri için kullanilabilecek matematik işlemler ve betimleyici ve sonuç çıkartıcı istatistiksel işlemler ve analizler değişiktir.
İsimsel ölçekte verilerde sayılar sadece birbirinden karşılıklı ayrılık gösteren kategorilere verilen adlardır ve bu isim/sayı sırası ve aralığı veya orijini için hiçbir matematiksel özellik yoktur. Bu çeşit ölçekte verilere ancak çok zayıf istatistik betimleyici ölçüler ve sonuç verici analizler uygulanabilir.
Sınıfsal ölçekte verilerdeki sayılar birbirinden karşılıklı ayrantılı kategorilere isim verdiği gibi bu kategoriler arasındaki rütbe ve sıralı düzeni de açıklarlar. Sayı değerleri arasındaki sırasal düzen değiştirilemeden her kategoriye atıf edilen gerçek sayı değiştirilebilir (yani monotonik dönüşüm uygulanabilir.) Sayılar arasında büyükluk farkı önemli olmadığı için değişik kategori sayıları üzerinde uygulanan bir basit aritmetik işlem (toplama, çıkarma, çarpma veya bölme) anlamsız sonuçlar verebilir.
Aralıksal ölçekte veri sayıları gerçekten sayı olup aralarındaki değişikler basit aritmetik işlem için bile anlamlıdır. Ancak aralıksal ölçekde veri değerleri için sayıların başlama orijini (yani 0 değer) keyfidir. Örnegin ısı derecesi olarak elde edilen veriler aralıksaldır. Ölçüm ölçeği santigrad olabilir ancak değişik 0 orijin değerleri olan Kelvin-mutlak veya Fahrenhayt da olabilirler.
Oransal ölçekte veriler hem değişik ölçülmeler arasında farklar anlamlıdır ve hem de bunlar için gerçek bir 0 başlangıç noktası mevcuttur.
İsimsel veya sınıfsal ölçekle ölçülen değişkenler için veriler birlikte kategorik değişkenler olarak anılmakta ve aralıksal veya oransal ölçekte olan veriler kantitatif niceliksel değişkenler olarak adlandırılmaktadır.
Tanrı varsa eğer, ruhumu kutsasın... Ruhum varsa eğer!
ThinkerBeLL - avatarı
ThinkerBeLL
VIP VIP Üye
8 Eylül 2009       Mesaj #2
ThinkerBeLL - avatarı
VIP VIP Üye
İstatistik
MsXLabs.org & Temel Britannica
Sponsorlu Bağlantılar

İstatistik, sayısal bilgilerin işlenmesi ve yorumlanmasıyla ilgili yöntemlerle ilgilenen matematik dalıdır. İstatistikçi topladığı sayısal bilgileri amacına uygun olarak düzenleyip özetler; sonra bu bilgileri çözümler ve genellikle belirli teknikler kullanarak yeni bilgiler elde etmeye çalışır.
Bilgi toplamanın bir yolu kamuoyu yoklamasıdır. Örneğin, bir genel seçimde verilecek oyların önceden kestirilmesi için kamuoyu yoklamasına başvurulur. Bir kamuoyu yoklamasında toplumun tümünün içinden alınan birkaç bin kişilik bir örneğe sorular sorulur. Alınan yanıtlardan toplumun tümünün eğilimleri kestirilmeye çalışılır. Özellikleri ya da eğilimleri araştırılacak olan kümeye nüfus, onun içinden seçilen altkümeye örneklem denir. Kamuoyu yoklaması için istatistikçiler önce bir "rasgele örneklem" seçer. Nüfusun her öğesinin örnekleme girme olasılığının eşif olduğu bu rasgele örneklem, yeterince büyükse toplumun bütün kesimlerini temsil eder. Kamuoyu yoklaması sonuçlarının ne kadar doğru çıkacağını, başka bir deyişle doğru çıkma olasılığını saptamaya yarayan istatistik yöntemleri vardır.

İstatistikçilerin ellerindeki verileri nasıl çözümlediğini bir örnekle görelim.
25 öğrenci bulunan bir sınıfta matematik ve İngilizce sınavlarında alınan notlar aşağıda gösterilmiştir. Her öğrencinin notlarını gösteren rakam çiftinden ilki matematik, ikincisi İngilizce notunu göstermektedir.


İstatistik

Bu bilgileri grafikle gösterebiliriz. Matematik notlarının sıklık grafiğini çizelim. Grafikteki her sütunun uzunluğu, belirli bir notu alan öğrenci sayısını gösterir. Örneğin iki öğrencinin 3 aldığı, altı öğrencinin notunun da 5 olduğu grafikte görülmektedir.
Öğrencilerin matematik notlarının sıklık grafiği.
İstatistik

Benzer bir grafiği İngilizce notları için de çizebiliriz.
Öğrencilerin İngilizce notlarının sıklık grafiği.
İstatistik

Çizdiğimiz bu grafiklerden yararlanarak iki sınavın sonuçlarını karşılaştırabiliriz. Acaba öğrencilerin bir sınavdaki başarısı öbüründekinden daha fazla mıdır? Çizdiğimiz grafiklere bakarak bunu söylemek kolay değildir. Matematik notlarının İngilizce notlarına göre daha geniş bir aralığa dağıldığı grafiklerde çok açık olarak görülüyor. Gerçekten de matematik notlan, en düşük not olan 2 ile en yüksek not olan 10 arasında, dokuz notu kapsayan bir aralığa yayılmıştır. İngilizce'de alınan notlar ise 3 ile 7 arasındaki beş notluk bir aralık içinde yer almaktadır.
Matematikte daha çok öğrencinin yüksek not almış olduğu grafikte görülüyor. Bu görünüm doğrudur, ama biz sınıfın bir bölümünü değil tümünü değerlendirmeye çalışıyoruz. En çok sayıda öğrencinin aldığı notun matematikte 5, İngilizce'de 6 olduğu grafikte görülüyor. Bir değerler kümesinde en sık rastlanan değere (örneğimizde en çok sayıda öğrencinin aldığı not) istatistikte mod denir. Kümenin bütünüyle ilgili bir fikir verebilmek için mod bir tür ortalama değer olarak kullanılabilir. İstatistikçiler belirli bir kümeyle ilgili fikir verebilmek için değişik türde ortalamalar kullanırlar.
Başka tür bir ortalama bulmak için örneğimizdeki notlan büyüklüklerine göre sıraya koyup bu sıranın tam ortasında kalan elemanı alabiliriz. Ortanca (medyan) denen bu eleman, örneğimizdeki sıralamada 13. sıraya gelen öğrencinin aldığı nottur; her iki sınav için de bulunacak olan ortanca 5'tir.
En yaygın olarak kullanılan ortalama türü ise aritmetik ortalama'dn. Örneğimizde aritmetik ortalamayı bulmak için, sınavda alınan notları toplayıp öğrenci sayısına böleriz.
Matematik sınavında alman notların toplamı 130, öğrenci sayısı 25 olduğuna göre notlann aritmetik ortalaması kolayca bulunur:
İstatistik
İngilizce sınavında alınan notların toplamı da 130 olduğu için, o sınavda da notlann aritmetik ortalaması 5,2'dir.
Görülüyor ki, hangi tür ortalamayı kullanırsak kullanalım, iki sınavdaki notlann ortalama değeri ya aynı ya da birbirine çok yakındır. Ama notların dağılımı farklıdır; matematik sınavında alınan notlar daha geniş bir aralığa yayılmıştır.
Kimi zaman yalnızca bir öğrencinin aldığı çok yüksek ya da çok düşük bir not bu aralığı genişletebilir. Aşağıdaki grafiklerde böyle bir durumun dağılım üzerindeki etkisi görülüyor.


İstatistik

Grafikte görülen simetrik dağılımda aritmetik ortalamanın, ortancanın ve modun değeri 3'tür.

İstatistik

Ortanca ve mod değerleri bu grafikte de aynıdır; ama alınan biryüksek not (10) nedeniyle aritmetik ortalama yükselmiştir.
Eğer sınıfın bütünüyle ilgileniyorsak, sınıfın genel durumundan çok farklı bir öğrencinin notunu dikkate almamız gerekmez. Öğrencilerin büyük çoğunluğunun notlarının nasıl dağıldığını incelemenin bir yolu notların belirli bir değerden farkına bakmaktır. Bu farka sapma diyoruz. Çeşitli ortalamalar olduğu gibi, farklı yollardan bulunan değişik sapmalar da vardır. En basit yollardan biri aritmetik ortalamadan sapmaların aritmetik ortalaması olan ortalama sapmayı bulmaktır.
Matematik notlanndaki ortalama sapmayı bulmak için önce, alınan notları ve her birinin karşısına, alınan notların aritmetik ortalaması olan 5,2 ile farkını yazarız:


İstatistik

Ortalamadan farkların toplamını bulmak için, her notun ortalamadan farkını o notu alan öğrenci sayısı ile çarpar, bulduğumuz değerleri toplarız.
İstatistik
Bütün öğrencilerin aldıkları notların ortalamadan farklarının toplamı 40, öğrenci sayısı da 25 olduğuna göre ortalama sapma kolayca bulunur:
İstatistik
İngilizce notlanndaki ortalama sapmayı da aynı biçimde hesaplarsak 1,064 buluruz.
Ortalama çevresindeki dağılımı incelemekte çok kullanılan ölçülerden biri de varyans ve standart sapma hesaplamaktır. Varyans, ortalamadan sapmaların karelerinin ortalaması alınarak bulunur. Standart sapma ise varyansın kareköküdür.
Eğer her öğrencinin bu iki dersteki durumunu karşılaştırmak ve bir derste iyi olan öğrencinin ötekinde de iyi olup olmadığını incelemek istersek, başka bir istatistik yöntemi kullanırız. İki değişkenin karşılıklı ilişkilerinin bulunmasına yarayan bu yönteme korelasyon diyoruz. Bu yöntemi uygulamanın en basit yolu bir korelasyon grafiği çizmektir. Örneğimizin korelasyon grafiğini çizelim.
İki sınavda alınan notların karşılıklı ilişkisini gösteren korelasyon grafiği.
İstatistik

Her öğrencinin iki sınavdan aldığı notlar grafikteki noktaların koordinatlarını oluşturur. Herhangi bir öğrencinin matematik ve İngilizce'den aldığı notlar birbirine yakın ya da aynı olduğunda, bu öğrencinin notlarını gösteren nokta sol alt köşeden sağ üst köşeye uzanan köşegende ya da yakın çevresinde yer alan kareler içinde gösterilir. Noktalar bu kareler içinde ne kadar fazla yoğunlaşmışsa, öğrencilerin matematik ve İngilizce'deki başarıları arasındaki ilişkinin de o kadar güçlü olduğunu söyleyebiliriz.
Korelasyon yöntemini dikkatle kullanmak gerekir. Örneğin sigara içmekle akciğer kanseri arasında yüksek bir korelasyon yani güçlü bir ilişki olduğu ortaya konmuştur. Ama sigara içmenin akciğer kanserine neden olduğunu söyleyebilmemiz başka tıbbi kanıtlara dayanmaktadır. Eğer yalnızca korelasyona bakarak bir sonuç çıkarmak istersek, sigara içmenin akciğer kanserine neden olduğu sonucuna varabileceğimiz gibi, akciğer kanserinin sigara içmeye yol açtığı sonucuna da varabilirdik. Görüldüğü gibi korelasyon yöntemi ilişkiyi ortaya koyar, ama ilişkinin yönünü, hangi olayın hangisine yol açtığını göstermez.

Tanrı varsa eğer, ruhumu kutsasın... Ruhum varsa eğer!
Mavi Peri - avatarı
Mavi Peri
Ziyaretçi
1 Ağustos 2012       Mesaj #3
Mavi Peri - avatarı
Ziyaretçi
İstatistik

Bir konuyla ilgili toplanmış sayısal verileri inceleyen, düzenleyen, çözümleyen matematik dalı. Toplumsal, teknik vb. tüm alanlara uygulanır. Örneğin bir ülkedeki fiyat hareketleri üzerine bir inceleme ekonomi alanındaki, bir parçacığın sıvı içindeki davranışıyla ilgili verilerin işlenmesi teknik alandaki, trafik akışının denetlenmesi, sosyo-ekonomik bir uygulamadır. İstatistiğin temel kavramları olasılık kuramına dayanır. Üzerinde araştırma yapılan tüm grup "kitle" adını alır. Kitle sonlu-sonsuz ya da kesikli-sürekli olabilir. İstatistikte, incelenen tüm kitle üzerinde ölçüm yapmanın çok zor, pahalı ya da olanaksız olduğu durumlarda, kitlenin, örneklem denilen bir alt kümesinden veri toplanır. Bu işleme "örnekleme" denir. Örneğin bir fabrikanın ürettiği ampullerin ortalama ömrü saptanmaya çalışılıyorsa, kuşkusuz, rasgele seçilen örneklem incelenir. Elemanların kitleden alınma olasılıkları aynıysa, söz konusu olan, seçkisiz örneklemdir. Örneklemin ortalama değeri x, standart sapması s2 ile gösterilir. n elemanlı bir örnekte gözlemler x1, x2, ..., xn ile bu seçkisiz değişkenlerin her birinin ortalaması _ ise örneklem ortalamalarının beklenen (umulan) değeri de _dür. Ayrıca örneklemle kitlenin ortalama ve varyansları arasında da bağıntı kurulabilir, böylece örneklem aracılığıyla kitle hakkında yargıya varılır.

MsXLabs.org & MORPA Genel Kültür Ansiklopedisi
Avatarı yok
nötrino
Yasaklı
11 Mayıs 2018       Mesaj #4
Avatarı yok
Yasaklı

Korelasyon ve Korelasyon Katsayısı!


İstatistikte korelasyon, iki değişken arasında belirli bir yöndeki bağlantıyı ifade eder. Değişkenler arasındaki ilgili bağlantının derecesi korelasyon aracılığıyla belirlenir. Söz konusu değişkenler birbiri ile aynı yönde veya zıt yönde bir değişim gösteriyorsa iki değişkenin bağımlı olduğu sonucuna varılır.

Aynı yönde hareket eden değişkenler arasında pozitif korelasyon, zıt yönde hareket eden değişkenler arasında ise negatif korelasyon vardır. Korelasyon katsayısı 1 ve -1 aralığında bir değer alır. Bu bağlamda ilgili aralığa göre aşağıdaki sonuçlar gözlenir;
  • Korelasyon katsayısı 1'e eşit ise değişkenler arasında tam pozitif korelasyon veya doğrusal bağ söz konusudur. İlgili bağın kuvvet derecesi 1'e yakınlığı ile ölçülür.
  • Korelasyon katsayısı 0 ise bu durumda değişkenler arasında herhangi bir bağ söz konusu değildir. Bu nedenle değişkenin yönüne bakmak anlamsızdır.
  • Korelasyon katsayısı -1'e eşit ise değişkenler arasında tam negatif korelasyon söz konusudur. İlgili değer -1'e ne kadar yakınsa değişkenler de buna paralel olarak farklı yönlerde hareket eder.

Benzer Konular

3 Kasım 2013 / Daisy-BT Sosyoloji
13 Nisan 2011 / Misafir Soru-Cevap
27 Ekim 2010 / ThinkerBeLL Matematik