Penggunaan kriteria persetujuan. Kriteria kesepakatan kriteria kesepakatan dalam teknologi inovatif statistik

Antipiretik untuk anak-anak diresepkan oleh dokter anak. Namun ada situasi darurat demam dimana anak perlu segera diberikan obat. Kemudian orang tua mengambil tanggung jawab dan menggunakan obat antipiretik. Apa saja yang boleh diberikan kepada bayi? Bagaimana cara menurunkan suhu pada anak yang lebih besar? Obat apa yang paling aman?

Kriteria persetujuan (kepatuhan)

Untuk menguji hipotesis tentang kesesuaian distribusi empiris dengan hukum distribusi teoritis, indikator statistik khusus digunakan - kriteria goodness-of-fit (atau kriteria kepatuhan). Ini termasuk kriteria Pearson, Kolmogorov, Romanovsky, Yastremsky, dll. Sebagian besar kriteria kesepakatan didasarkan pada penggunaan penyimpangan frekuensi empiris dari frekuensi teoretis. Jelasnya, semakin kecil penyimpangan ini, semakin baik distribusi teoretisnya sesuai dengan distribusi empiris (atau menggambarkannya).

Kriteria persetujuan - ini adalah kriteria untuk menguji hipotesis tentang kesesuaian distribusi empiris dengan distribusi probabilitas teoretis. Kriteria tersebut dibagi menjadi dua kelas: umum dan khusus. Uji goodness-of-fit umum diterapkan pada rumusan hipotesis yang paling umum, yaitu hipotesis yang hasil observasinya sesuai dengan distribusi probabilitas yang diasumsikan secara a priori. Uji kesesuaian khusus melibatkan hipotesis nol khusus yang menyatakan kesesuaian dengan bentuk distribusi probabilitas tertentu.

Kriteria kesepakatan, berdasarkan hukum distribusi yang ditetapkan, memungkinkan untuk menetapkan kapan perbedaan antara frekuensi teoretis dan empiris harus dianggap tidak signifikan (acak), dan kapan dianggap signifikan (non-acak). Oleh karena itu, kriteria kesepakatan memungkinkan untuk menolak atau mengkonfirmasi kebenaran hipotesis yang diajukan ketika menyelaraskan deret tentang sifat distribusi dalam deret empiris dan untuk menjawab apakah mungkin untuk menerima distribusi empiris tertentu. model yang diungkapkan oleh beberapa hukum distribusi teoritis.

Uji kesesuaian χ 2 (chi-kuadrat) Pearson adalah salah satu uji kesesuaian yang utama. Diusulkan oleh ahli matematika Inggris Karl Pearson (1857-1936) untuk menilai keacakan (signifikansi) perbedaan antara frekuensi distribusi empiris dan teoritis:

Di mana k- jumlah kelompok yang distribusi empirisnya dibagi; fi- frekuensi empiris suatu sifat dalam Saya-kelompok ke-; / ts °р - frekuensi teoritis masuk saya-itu kelompok.

Skema penerapan kriteria kamu) untuk menilai konsistensi distribusi teoritis dan empiris adalah sebagai berikut.

  • 1. Ukuran perbedaan yang dihitung % 2 asc ditentukan.
  • 2. Tentukan besarnya derajat kebebasan.
  • 3. Berdasarkan banyaknya derajat kebebasan v, %^bl ditentukan dengan menggunakan tabel khusus
  • 4. Jika % 2 asch >x 2 abl, maka untuk tingkat signifikansi a tertentu dan jumlah derajat kebebasan v, hipotesis tentang tidak signifikannya (keacakan) perbedaan tersebut ditolak. Jika tidak, hipotesis dapat dianggap tidak bertentangan dengan data eksperimen yang diperoleh dan dengan probabilitas (1 - a) dapat dikatakan bahwa perbedaan antara frekuensi teoritis dan empiris bersifat acak.

Tingkat signifikansi - ini adalah kemungkinan menolak hipotesis yang diajukan secara keliru, yaitu. kemungkinan hipotesis yang benar akan ditolak. Dalam studi statistik, tergantung pada pentingnya dan tanggung jawab masalah yang dipecahkan, tiga tingkat signifikansi berikut digunakan:

  • 1) a = 0,1, maka P = 0,9;
  • 2) a = 0,05, maka P = 0,95;
  • 3) a = 0,01, maka P = 0,99.

Menggunakan kriteria goodness-of-fit kamu), Kondisi berikut harus dipenuhi.

  • 1. Volume penduduk yang diteliti harus memenuhi syarat hal> 50, sedangkan frekuensi atau ukuran grupnya minimal harus 5. Jika syarat ini dilanggar, maka perlu digabungkan terlebih dahulu frekuensi-frekuensi kecil (kurang dari 5).
  • 2. Distribusi empiris harus terdiri dari data yang diperoleh dari hasil pengambilan sampel secara acak, yaitu. mereka harus mandiri.

Kerugian dari kriteria goodness-of-fit Pearson adalah hilangnya sebagian informasi asli terkait dengan kebutuhan untuk mengelompokkan hasil observasi ke dalam interval dan menggabungkan interval individu dengan sejumlah kecil observasi. Dalam hal ini, disarankan untuk melengkapi pemeriksaan kepatuhan distribusi dengan kriteria kamu) kriteria lainnya. Hal ini terutama diperlukan bila ukuran sampelnya besar P ~ 100.

Dalam statistik, uji kesesuaian Kolmogorov (juga dikenal sebagai uji kesesuaian Kolmogorov – Smirnov) digunakan untuk menentukan apakah dua distribusi empiris mematuhi hukum yang sama, atau untuk menentukan apakah distribusi yang dihasilkan mematuhi model yang diasumsikan. . Kriteria Kolmogorov didasarkan pada penentuan perbedaan maksimum antara frekuensi akumulasi atau frekuensi distribusi empiris atau teoritis. Kriteria Kolmogorov dihitung menggunakan rumus berikut:

Di mana D Dan D- karenanya, perbedaan maksimum antara frekuensi akumulasi (/-/") dan antara frekuensi akumulasi ( rr") rangkaian distribusi empiris dan teoritis; N- jumlah unit secara agregat.

Setelah menghitung nilainya X, tabel khusus digunakan untuk menentukan probabilitas yang dapat menyatakan bahwa penyimpangan frekuensi empiris dari frekuensi teoritis adalah acak. Jika tandanya bernilai hingga 0,3, maka ini berarti ada kebetulan frekuensi yang lengkap. Dengan jumlah observasi yang banyak, uji Kolmogorov mampu mendeteksi adanya penyimpangan terhadap hipotesis. Artinya, perbedaan distribusi sampel dengan distribusi teoritis akan dapat dideteksi dengan bantuannya jika jumlah observasi cukup banyak. Signifikansi praktis dari sifat ini tidak signifikan, karena dalam banyak kasus sulit untuk mengandalkan perolehan sejumlah besar pengamatan dalam kondisi konstan, gagasan teoretis tentang hukum distribusi yang harus dipatuhi sampel selalu merupakan perkiraan, dan keakuratan uji statistik tidak boleh melebihi keakuratan model yang dipilih.

Uji kesesuaian Romanovsky didasarkan pada penggunaan kriteria Pearson, yaitu. sudah ditemukan nilai x 2 > dan jumlah derajat kebebasan:

dimana v adalah jumlah derajat kebebasan variasi.

Kriteria Romanovsky cocok digunakan karena tidak adanya tabel untuk x2. Jika K r KE? > 3, maka distribusi tersebut non-acak dan distribusi teoritis tidak dapat dijadikan model untuk distribusi empiris yang sedang dipelajari.

B. S. Yastremsky menggunakan kriteria kesepakatan bukan jumlah derajat kebebasan, tetapi jumlah kelompok ( k), nilai khusus 0, bergantung pada jumlah kelompok, dan nilai chi-kuadrat. Kriteria kesepakatan Yastremsky memiliki arti yang sama dengan kriteria Romanovsky dan dinyatakan dengan rumus

dimana x 2 adalah uji kesesuaian Pearson; /e gr - jumlah grup; 0 - koefisien, untuk jumlah kelompok kurang dari 20 sama dengan 0,6.

Jika 1ph bertindak > 3, perbedaan antara distribusi teoretis dan empiris tidak bersifat acak, yaitu. distribusi empiris tidak memenuhi persyaratan distribusi normal. Jika 1f bertindak

Frekuensi teoritis dan empiris. Memeriksa distribusi normal

Saat menganalisis rangkaian distribusi variasi, caranya sangat penting distribusi empiris tanda sesuai normal. Untuk melakukan hal ini, frekuensi distribusi aktual harus dibandingkan dengan frekuensi teoritis yang merupakan ciri distribusi normal. Artinya, berdasarkan data aktual, perlu dihitung frekuensi teoritis kurva distribusi normal yang merupakan fungsi dari simpangan ternormalisasi.

Dengan kata lain, kurva distribusi empiris perlu disejajarkan dengan kurva distribusi normal.

Karakteristik objektif dari kepatuhan teoretis Dan empiris frekuensi dapat diperoleh dengan menggunakan indikator statistik khusus yang disebut kriteria persetujuan.

Kriteria kesepakatan disebut kriteria yang memungkinkan Anda menentukan apakah ada perbedaan empiris Dan teoretis distribusinya acak atau signifikan, yaitu apakah data observasi sesuai dengan hipotesis statistik yang diajukan atau tidak. Sebaran penduduk yang dimilikinya berdasarkan hipotesis yang diajukan disebut teoritis.

Ada kebutuhan untuk menginstal kriteria(aturan) yang memungkinkan seseorang menilai apakah perbedaan antara distribusi empiris dan teoritis bersifat acak atau signifikan. Jika ternyata ada perbedaan acak, maka mereka yakin bahwa data pengamatan (sampel) tersebut sesuai dengan hipotesis yang diajukan tentang hukum sebaran populasi umum dan oleh karena itu hipotesis diterima; jika ternyata ada perbedaan penting, maka data observasi tidak sesuai dengan hipotesis dan ditolak.

Biasanya, frekuensi empiris dan teoritis berbeda karena:

    perbedaan tersebut bersifat acak dan disebabkan oleh terbatasnya jumlah pengamatan;

    Perbedaan ini bukan suatu kebetulan dan dijelaskan oleh fakta bahwa hipotesis statistik bahwa populasi berdistribusi normal adalah keliru.

Dengan demikian, kriteria persetujuan memungkinkan untuk menolak atau membenarkan kebenaran hipotesis yang diajukan ketika menyelaraskan deret tentang sifat sebaran dalam deret empiris.

Frekuensi empiris diperoleh sebagai hasil observasi. Frekuensi teoritis dihitung menggunakan rumus.

Untuk hukum distribusi normal mereka dapat ditemukan sebagai berikut:

    Σƒ saya- jumlah akumulasi frekuensi empiris (kumulatif).

    h - perbedaan antara dua opsi yang bertetangga

    σ - deviasi standar sampel

    t – deviasi yang dinormalisasi (terstandarisasi).

    φ(t)–fungsi kepadatan probabilitas berdistribusi normal (ditemukan dari tabel nilai fungsi Laplace lokal untuk nilai t yang sesuai)

Ada beberapa uji kesesuaian, yang paling umum adalah: uji chi-kuadrat (Pearson), uji Kolmogorov, dan uji Romanovsky.

Pearson χ uji kesesuaian 2 – salah satu yang utama, yang dapat direpresentasikan sebagai jumlah rasio kuadrat perbedaan antara frekuensi teoritis (f T) dan empiris (f) terhadap frekuensi teoritis:

    k adalah jumlah kelompok yang distribusi empirisnya dibagi,

    f i – frekuensi pengamatan sifat pada kelompok ke-i,

    f T – frekuensi teoritis.

Untuk distribusi χ 2, telah disusun tabel yang menunjukkan nilai kritis kriteria goodness-of-fit χ 2 untuk tingkat signifikansi yang dipilih dan derajat kebebasan df (atau ν). Tingkat signifikansi α adalah kemungkinan salah menolak hipotesis yang diajukan, yaitu. kemungkinan hipotesis yang benar akan ditolak. R - signifikansi statistik menerima hipotesis yang benar. Dalam statistik, tiga tingkat signifikansi paling sering digunakan:

α=0,10, lalu P=0,90 (dalam 10 kasus dari 100)

α=0,05, lalu P=0,95 (dalam 5 kasus dari 100)

α=0,01, maka P=0,99 (dalam 1 kasus dari 100) hipotesis yang benar dapat ditolak

Jumlah derajat kebebasan df didefinisikan sebagai jumlah grup dalam deret distribusi dikurangi jumlah koneksi: df = k –z. Banyaknya koneksi dipahami sebagai banyaknya indikator deret empiris yang digunakan dalam menghitung frekuensi teoritis, yaitu. indikator yang menghubungkan frekuensi empiris dan teoritis. Misalnya, jika disejajarkan dengan kurva lonceng, terdapat tiga hubungan. Oleh karena itu, ketika diselaraskan oleh kurva lonceng jumlah derajat kebebasan didefinisikan sebagai df =k–3. Untuk menilai signifikansi, nilai yang dihitung dibandingkan dengan tabel χ 2

Jika distribusi teoritis dan empiris benar-benar bertepatan, χ 2 =0, jika tidak χ 2 >0. Jika χ 2 kal > χ 2 tab, maka untuk tingkat signifikansi dan jumlah derajat kebebasan tertentu, kami menolak hipotesis tentang tidak pentingnya (keacakan) perbedaan tersebut. Jika χ 2 dihitung< χ 2 табл то гипотезу принимаем и с вероятностью Р=(1-α) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно. Следовательно, есть основания утверждать, что эмпирическое распределение подчиняетсяdistribusi normal. Uji kesesuaian Pearson digunakan jika ukuran populasi cukup besar (N>50), dan frekuensi setiap kelompok minimal harus 5.

Tes kesesuaian Kolmogorov didasarkan pada penentuan perbedaan maksimum antara akumulasi frekuensi empiris dan teoritis:

dimana D dan d masing-masing adalah perbedaan maksimum antara frekuensi akumulasi dan frekuensi akumulasi distribusi empiris dan teoritis. Dengan menggunakan tabel distribusi statistik Kolmogorov, probabilitas ditentukan, yang dapat bervariasi dari 0 hingga 1. Ketika P(λ) = 1, terdapat frekuensi yang benar-benar kebetulan, P(λ) = 0 - perbedaan total. Jika nilai probabilitas P signifikan terhadap nilai yang ditemukan λ, maka kita dapat mengasumsikan bahwa perbedaan antara distribusi teoritis dan empiris tidak signifikan, yaitu acak. Syarat utama untuk menggunakan kriteria Kolmogorov adalah jumlah observasi yang cukup banyak.

Tes kesesuaian Kolmogorov

Mari kita perhatikan bagaimana kriteria Kolmogorov (λ) diterapkan ketika menguji hipotesis distribusi normal populasi umum. Menyelaraskan distribusi aktual dengan kurva lonceng terdiri dari beberapa langkah:

    Bandingkan frekuensi aktual dan teoritis.

    Berdasarkan data aktual, frekuensi teoritis dari kurva distribusi normal, yang merupakan fungsi dari deviasi ternormalisasi, ditentukan.

    Mereka memeriksa sejauh mana distribusi karakteristik tersebut sesuai dengan normal.

Untuk kolom IV tabel:

Di MS Excel, deviasi ternormalisasi (t) dihitung menggunakan fungsi NORMALISASI. Penting untuk memilih rentang sel bebas berdasarkan jumlah opsi (baris spreadsheet). Tanpa menghapus pilihan, panggil fungsi NORMALIZE. Pada kotak dialog yang muncul, tunjukkan sel-sel berikut, yang masing-masing berisi nilai pengamatan (X i), rata-rata (X) dan simpangan baku Ϭ. Operasi harus diselesaikan serentak dengan menekan Ctrl+Shift+Enter

Untuk kolom V tabel:

Fungsi kepadatan probabilitas dari distribusi normal φ(t) ditemukan dari tabel nilai fungsi Laplace lokal untuk nilai yang sesuai dari deviasi ternormalisasi (t)

Untuk kolom VI tabel:

Tes kesesuaian Kolmogorov (λ) ditentukan dengan membagi modul perbedaan maksimal antara frekuensi kumulatif empiris dan teoritis dengan akar kuadrat dari jumlah observasi:

Dengan menggunakan tabel probabilitas khusus untuk kriteria kesepakatan λ, kami menentukan bahwa nilai λ = 0,59 sesuai dengan probabilitas 0,88 (λ

Distribusi frekuensi empiris dan teoritis, kepadatan probabilitas distribusi teoritis

Saat menerapkan uji kesesuaian untuk memeriksa apakah distribusi yang diamati (empiris) sesuai dengan distribusi teoritis, seseorang harus membedakan antara pengujian hipotesis sederhana dan kompleks.

Uji normalitas Kolmogorov-Smirnov satu sampel didasarkan pada perbedaan maksimum antara distribusi empiris kumulatif sampel dan distribusi kumulatif estimasi (teoretis). Jika statistik Kolmogorov-Smirnov D signifikan, maka hipotesis bahwa distribusi yang bersesuaian adalah normal harus ditolak.

Kriteria untuk memeriksa keacakan dan menilai observasi outlier Pengantar Sastra Dalam praktik analisis statistik data eksperimen, yang menjadi perhatian utama bukanlah perhitungan statistik tertentu itu sendiri, melainkan jawaban atas pertanyaan-pertanyaan jenis ini. Oleh karena itu, banyak kriteria telah dikembangkan untuk menguji hipotesis statistik yang diajukan. Semua kriteria untuk menguji hipotesis statistik dibagi menjadi dua kelompok besar: parametrik dan nonparametrik.


Bagikan pekerjaan Anda di jejaring sosial

Jika karya ini tidak cocok untuk Anda, di bagian bawah halaman terdapat daftar karya serupa. Anda juga dapat menggunakan tombol pencarian


Tes

Menggunakan Kriteria Persetujuan

Perkenalan

literatur

Perkenalan

Dalam praktek analisis statistik data eksperimen, yang menjadi perhatian utama bukanlah perhitungan statistik tertentu itu sendiri, melainkan jawaban atas pertanyaan-pertanyaan semacam itu. Apakah rata-rata populasi benar-benar sama dengan suatu angka tertentu? Apakah koefisien korelasi berbeda nyata dari nol? Apakah varians kedua sampel sama? Dan banyak pertanyaan serupa yang mungkin muncul, bergantung pada masalah penelitian spesifik. Oleh karena itu, banyak kriteria telah dikembangkan untuk menguji hipotesis statistik yang diajukan. Kami akan mempertimbangkan beberapa yang paling umum. Hal ini terutama berkaitan dengan mean, varians, koefisien korelasi dan distribusi kelimpahan.

Semua kriteria untuk menguji hipotesis statistik dibagi menjadi dua kelompok besar: parametrik dan nonparametrik. Uji parametrik didasarkan pada asumsi bahwa data sampel diambil dari populasi yang sebarannya diketahui, dan tugas utamanya adalah memperkirakan parameter sebaran tersebut. Pengujian nonparametrik tidak memerlukan asumsi apa pun tentang sifat distribusi, selain asumsi bahwa distribusi tersebut kontinu.

Mari kita lihat kriteria parametriknya terlebih dahulu. Urutan pengujian akan meliputi perumusan hipotesis nol dan hipotesis alternatif, perumusan asumsi yang akan dibuat, penentuan statistik sampel yang digunakan dalam pengujian dan, pembentukan distribusi sampel dari statistik yang diuji, penentuan daerah kritis untuk kriteria yang dipilih, dan konstruksi interval kepercayaan untuk statistik sampel.

1 Kriteria kelayakan sarana

Biarkan hipotesis yang diuji menjadi parameter populasi. Kebutuhan akan pemeriksaan tersebut mungkin timbul, misalnya, dalam situasi berikut. Misalkan, berdasarkan penelitian ekstensif, diameter cangkang fosil moluska dalam sedimen dari suatu lokasi tetap telah ditentukan. Mari kita juga memiliki sejumlah cangkang yang ditemukan di tempat lain, dan kita berasumsi bahwa tempat tertentu tidak mempengaruhi diameter cangkang, yaitu. bahwa nilai rata-rata diameter cangkang seluruh populasi moluska yang pernah hidup di tempat baru sama dengan nilai yang diketahui yang diperoleh sebelumnya ketika mempelajari jenis moluska tersebut di habitat pertamanya.

Jika nilai yang diketahui ini sama, maka hipotesis nol dan hipotesis alternatif ditulis sebagai berikut: Misalkan variabel x dalam populasi yang dipertimbangkan berdistribusi normal, dan nilai varians populasi tidak diketahui.

Kami akan menguji hipotesis menggunakan statistik:

, (1)
di mana adalah deviasi standar sampel.

Ditunjukkan bahwa jika benar, maka t pada persamaan (1) mempunyai distribusi t Student dengan derajat kebebasan n-1. Jika Anda memilih tingkat signifikansi (probabilitas menolak hipotesis yang benar) sama, maka sesuai dengan yang telah dibahas pada bab sebelumnya, Anda dapat menentukan nilai kritis untuk pengujian =0.

Dalam hal ini, karena distribusi Student simetris, maka (1-) bagian dari area di bawah kurva distribusi ini dengan n-1 derajat kebebasan akan terdapat di antara titik-titik dan, yang nilai absolutnya sama satu sama lain. . Oleh karena itu, semua nilai yang kurang dari nilai negatif dan lebih besar dari nilai positif untuk distribusi-t dengan sejumlah derajat kebebasan tertentu pada tingkat signifikansi yang dipilih akan merupakan wilayah kritis. Jika nilai t sampel berada dalam wilayah ini, maka hipotesis alternatif diterima.

Interval kepercayaan untuk dibuat menggunakan metode yang dijelaskan sebelumnya dan ditentukan dari ekspresi berikut

(2)

Jadi, dalam kasus kita, mari kita ketahui bahwa diameter cangkang fosil moluska adalah 18,2 mm. Kami memiliki sampel 50 cangkang yang baru ditemukan, dengan mm, a = 2,18 mm. Mari kita periksa: =18.2 melawan Kita punya

Jika tingkat signifikansi yang dipilih =0,05, maka nilai kritisnya. Oleh karena itu, hal tersebut dapat ditolak dan diterima pada tingkat signifikansi = 0,05. Jadi, untuk contoh hipotetis kita, dapat dikatakan (tentu saja dengan beberapa kemungkinan) bahwa diameter cangkang fosil moluska spesies tertentu bergantung pada tempat tinggalnya.

Karena distribusi t simetris, hanya nilai t positif dari distribusi ini yang diberikan pada tingkat signifikansi yang dipilih dan jumlah derajat kebebasan. Selain itu, tidak hanya bagian wilayah di bawah kurva distribusi di sebelah kanan nilai t yang diperhitungkan, tetapi juga di sebelah kiri nilai -t. Hal ini disebabkan oleh fakta bahwa dalam banyak kasus, ketika menguji hipotesis, kita tertarik pada signifikansi penyimpangan itu sendiri, terlepas dari apakah penyimpangan tersebut lebih besar atau lebih kecil, yaitu. kami memeriksa, bukan melawan: >a atau:

Mari kita kembali ke contoh kita sekarang. Selang kepercayaan 100(1-)% adalah

18,92,01

Sekarang mari kita pertimbangkan kasus ketika kita perlu membandingkan rata-rata dua populasi umum. Hipotesis yang diuji seperti ini: : =0, : 0. Diasumsikan juga berdistribusi normal dengan mean dan varians, dan - berdistribusi normal dengan mean dan varians yang sama. Selain itu, kami berasumsi bahwa sampel yang digunakan untuk memperkirakan populasi umum diekstraksi secara independen satu sama lain dan memiliki volume masing-masing, dan Dari independensi sampel, maka jika kita mengambil jumlah yang lebih besar dan menghitung rata-ratanya. nilai untuk setiap pasangan, maka himpunan pasangan rata-rata tersebut akan sama sekali tidak berkorelasi.

Pengujian hipotesis nol dilakukan dengan menggunakan statistik

(3)

dimana dan adalah estimasi varians untuk sampel pertama dan kedua. Sangat mudah untuk melihat bahwa (3) merupakan generalisasi dari (1).

Statistik (3) menunjukkan distribusi t Student dengan derajat kebebasan. Jika dan sama, mis. = = rumus (3) disederhanakan dan berbentuk

(4)

Mari kita lihat sebuah contoh. Misalkan kita mengukur jumlah daun batang dari populasi tanaman yang sama selama dua musim, diperoleh hasil sebagai berikut: Kita asumsikan kondisi untuk menggunakan uji Student, yaitu: normalitas populasi dari mana sampel diambil, adanya varians yang tidak diketahui tetapi sama untuk populasi tersebut, dan independensi sampel terpenuhi. Mari kita perkirakan pada tingkat signifikansi =0,01. Kita punya

Nilai tabel t = 2,58. Oleh karena itu, hipotesis tentang persamaan nilai rata-rata panjang batang daun suatu populasi tanaman selama dua musim harus ditolak pada tingkat signifikansi yang dipilih.

Perhatian! Hipotesis nol dalam statistik matematika adalah hipotesis bahwa tidak ada perbedaan yang signifikan antara indikator-indikator yang dibandingkan, terlepas dari apakah kita berbicara tentang mean, varians, atau statistik lainnya. Dan dalam semua kasus ini, jika nilai empiris (dihitung dengan rumus) dari kriteria lebih besar dari nilai teoritis (dipilih dari tabel), maka ditolak. Jika nilai empirisnya lebih kecil dari nilai tabulasi, maka diterima.

Untuk membangun selang kepercayaan untuk selisih rata-rata kedua populasi ini, mari kita perhatikan fakta bahwa uji Student, seperti dapat dilihat dari rumus (3), mengevaluasi signifikansi perbedaan antara rata-rata relatif. dengan kesalahan standar dari perbedaan ini. Sangat mudah untuk memverifikasi bahwa penyebut pada (3) mewakili kesalahan standar ini dengan menggunakan hubungan dan asumsi yang telah dibahas sebelumnya. Faktanya, kita mengetahuinya secara umum

Jika x dan y independen, maka independen juga

Mengambil nilai sampel dan bukannya x dan y, dan mengingat asumsi yang dibuat bahwa kedua populasi memiliki varian yang sama, kita peroleh

(5)

Estimasi varians dapat diperoleh dari hubungan berikut

(6)

(Kami membaginya karena dua kuantitas diperkirakan dari sampel dan, oleh karena itu, jumlah derajat kebebasan harus dikurangi dua.)

Jika sekarang kita substitusikan (6) ke (5) dan ambil akar kuadratnya, kita mendapatkan penyebutnya dalam ekspresi (3).

Setelah penyimpangan ini, mari kita kembali membangun interval kepercayaan untuk melalui -.

Kita punya

Mari kita berikan beberapa komentar terkait asumsi yang digunakan dalam membangun uji-t. Pertama-tama, terlihat bahwa pelanggaran asumsi normalitas berpengaruh tidak signifikan terhadap tingkat signifikansi dan kekuatan uji 30. Pelanggaran asumsi homogenitas varians kedua populasi yang dijadikan sampel adalah juga tidak signifikan, tetapi hanya jika ukuran sampelnya sama. Jika varians kedua populasi berbeda satu sama lain, maka probabilitas kesalahan tipe pertama dan kedua akan berbeda secara signifikan dari yang diharapkan.

Dalam hal ini, kriteria harus digunakan untuk memeriksa

(7)

dengan jumlah derajat kebebasan

. (8)

Biasanya, ini adalah bilangan pecahan, oleh karena itu, ketika menggunakan tabel distribusi t, perlu untuk mengambil nilai tabel untuk nilai bilangan bulat terdekat dan melakukan interpolasi untuk menemukan t yang sesuai dengan memperoleh satu.

Mari kita lihat sebuah contoh. Saat mempelajari dua subspesies katak danau, rasio panjang tubuh terhadap panjang tibia dihitung. Diambil dua sampel dengan volume =49 dan =27. Rata-rata dan varians dari hubungan yang kita minati ternyata sama, masing-masing =2,34; =2,08; =0,21; =0,35. Jika sekarang kita menguji hipotesis dengan menggunakan rumus (2), kita memperolehnya

Pada tingkat signifikansi =0,05, kita harus menolak hipotesis nol (nilai tabel t = 1,995) dan berasumsi bahwa terdapat perbedaan yang signifikan secara statistik pada tingkat signifikansi yang dipilih antara nilai rata-rata parameter yang diukur untuk kedua subspesies katak. .

Saat menggunakan rumus (6) dan (7) yang kita miliki

Dalam hal ini, untuk tingkat signifikansi yang sama =0,05, nilai tabelnya adalah t=2,015, dan hipotesis nol diterima.

Contoh ini dengan jelas menunjukkan bahwa mengabaikan kondisi yang diadopsi ketika menurunkan kriteria tertentu dapat menyebabkan hasil yang berlawanan dengan hasil yang sebenarnya terjadi. Tentu saja, dalam hal ini, dengan memiliki sampel dengan ukuran yang berbeda tanpa adanya fakta yang telah ditentukan sebelumnya bahwa varians dari indikator yang diukur pada kedua populasi adalah sama secara statistik, maka perlu menggunakan rumus (7) dan (8), yang mana menunjukkan tidak adanya perbedaan yang signifikan secara statistik.

Oleh karena itu, saya ingin mengulangi sekali lagi bahwa memeriksa kepatuhan terhadap semua asumsi yang dibuat ketika menurunkan kriteria tertentu merupakan kondisi yang mutlak diperlukan untuk penggunaan yang benar.

Persyaratan konstan dalam kedua modifikasi uji-t di atas adalah persyaratan bahwa sampel tidak bergantung satu sama lain. Namun, dalam praktiknya sering kali terdapat situasi di mana persyaratan ini tidak dapat dipenuhi karena alasan obyektif. Misalnya, beberapa indikator diukur pada hewan atau wilayah yang sama sebelum dan sesudah pengaruh faktor eksternal, dll. Dan dalam kasus ini kita mungkin tertarik untuk menguji hipotesis tersebut. Kami akan terus berasumsi bahwa kedua sampel diambil dari populasi normal dengan varian yang sama.

Dalam hal ini kita dapat memanfaatkan fakta bahwa selisih antara besaran-besaran yang berdistribusi normal juga mempunyai distribusi normal, oleh karena itu kita dapat menggunakan uji t Student dalam bentuk (1). Dengan demikian, hipotesis akan diuji bahwa n perbedaan adalah sampel dari populasi yang berdistribusi normal dengan mean sama dengan nol.

Menunjukkan perbedaan ke-i dengan, kita punya

, (9)
Di mana

Mari kita lihat sebuah contoh. Mari kita miliki data tentang jumlah impuls sel saraf individu selama interval waktu tertentu sebelum () dan sesudah () aksi stimulus:

Oleh karena itu, dengan mengingat bahwa (9) memiliki distribusi t, dan memilih tingkat signifikansi =0,01, dari tabel terkait di Lampiran kita menemukan bahwa nilai kritis t untuk n-1=10-1=9 derajat kebebasan adalah 3,25. Perbandingan nilai t-statistik teoritis dan empiris menunjukkan bahwa hipotesis nol tentang tidak adanya perbedaan yang signifikan secara statistik antara tingkat pemecatan sebelum dan sesudah stimulus harus ditolak. Dapat disimpulkan bahwa stimulus yang digunakan secara statistik mengubah frekuensi impuls secara signifikan.

Dalam penelitian eksperimental, seperti disebutkan di atas, sampel dependen cukup sering muncul. Namun, fakta ini terkadang diabaikan dan uji-t digunakan secara salah pada bentuk (3).

Ketidaktepatan hal ini dapat dilihat dengan mempertimbangkan kesalahan standar perbedaan antara rata-rata tidak berkorelasi dan berkorelasi. Dalam kasus pertama

Dan yang kedua

Kesalahan standar dari selisih d adalah

Dengan mengingat hal ini, penyebut pada (9) akan berbentuk

Sekarang mari kita perhatikan fakta bahwa pembilang ekspresi (4) dan (9) bertepatan:

oleh karena itu, selisih nilai t di dalamnya bergantung pada penyebutnya.

Jadi, jika rumus (3) digunakan pada permasalahan dengan sampel dependen, dan sampel tersebut mempunyai korelasi positif, maka nilai t yang dihasilkan akan lebih kecil dari yang seharusnya jika menggunakan rumus (9), dan dapat timbul situasi. dimana hipotesis nol akan diterima jika hipotesis tersebut salah. Situasi sebaliknya mungkin muncul bila terdapat korelasi negatif antar sampel, yaitu dalam hal ini perbedaan akan dianggap signifikan padahal sebenarnya tidak signifikan.

Mari kita kembali ke contoh aktivitas impulsif dan menghitung nilai t untuk data yang diberikan menggunakan rumus (3), tanpa memperhatikan fakta bahwa sampel-sampel tersebut saling berhubungan. Kita mempunyai: Untuk jumlah derajat kebebasan sama dengan 18, dan tingkat signifikansi = 0,01, nilai tabelnya adalah t = 2,88 dan, sekilas, tampak tidak terjadi apa-apa, meskipun menggunakan rumus yang tidak sesuai untuk persamaan tersebut. kondisi tertentu. Dan dalam hal ini, nilai t yang dihitung mengarah pada penolakan hipotesis nol, yaitu. sampai pada kesimpulan yang sama yang dibuat dengan menggunakan rumus (9), benar dalam situasi ini.

Namun mari kita format ulang data yang ada dan sajikan dalam bentuk berikut (2):

Ini adalah nilai yang sama, dan dapat diperoleh dalam salah satu percobaan. Karena semua nilai pada kedua sampel dipertahankan, maka menggunakan uji t Student pada rumus (3) memberikan nilai yang diperoleh sebelumnya = 3,32 dan mengarah pada kesimpulan yang sama dengan yang telah dibuat.

Sekarang mari kita hitung nilai t menggunakan rumus (9), yang harus digunakan dalam kasus ini. Kita mempunyai: Nilai kritis t pada tingkat signifikansi yang dipilih dan sembilan derajat kebebasan adalah 3,25. Oleh karena itu, kami tidak mempunyai alasan untuk menolak hipotesis nol, kami menerimanya, dan ternyata kesimpulan tersebut berbanding terbalik dengan kesimpulan yang diambil dengan menggunakan rumus (3).

Dengan menggunakan contoh ini, kami sekali lagi diyakinkan betapa pentingnya mematuhi semua persyaratan yang menjadi dasar penentuan kriteria tertentu untuk memperoleh kesimpulan yang benar ketika menganalisis data eksperimen.

Modifikasi uji Siswa yang dipertimbangkan dimaksudkan untuk menguji hipotesis mengenai rata-rata dua sampel. Namun, situasi muncul ketika kesimpulan perlu ditarik mengenai kesetaraan k rata-rata pada saat yang bersamaan. Untuk hal ini juga telah dikembangkan prosedur statistik tertentu, yang akan dibahas kemudian ketika membahas masalah-masalah yang berkaitan dengan analisis varians.

2 Uji kesesuaian untuk variansi

Pengujian hipotesis statistik mengenai varians populasi dilakukan dalam urutan yang sama seperti rata-rata. Mari kita ingat secara singkat urutan ini.

1. Hipotesis nol dirumuskan (tentang tidak adanya perbedaan signifikan secara statistik antara varians yang dibandingkan).

2. Beberapa asumsi dibuat mengenai distribusi sampling statistik yang direncanakan untuk memperkirakan parameter yang termasuk dalam hipotesis.

3. Tingkat signifikansi untuk menguji hipotesis dipilih.

4. Nilai statistik yang menarik bagi kami dihitung dan keputusan dibuat mengenai kebenaran hipotesis nol.

Sekarang mari kita mulai dengan menguji hipotesis bahwa varians populasi =a, yaitu. melawan. Jika kita berasumsi bahwa variabel x berdistribusi normal dan sampel berukuran n diambil secara acak dari populasi, maka statistik digunakan untuk menguji hipotesis nol.

(10)

Mengingat rumus menghitung dispersi, kita menulis ulang (10) sebagai berikut:

. (11)

Dari ungkapan ini jelas bahwa pembilangnya adalah jumlah kuadrat simpangan nilai-nilai yang berdistribusi normal dari rata-ratanya. Masing-masing penyimpangan tersebut juga berdistribusi normal. Oleh karena itu, sesuai dengan distribusi yang kita ketahui, jumlah kuadrat nilai statistik yang terdistribusi normal (10) dan (11) mempunyai distribusi - dengan derajat kebebasan n-1.

Dengan analogi penggunaan distribusi-t, ketika memeriksa tingkat signifikansi yang dipilih, titik kritis ditetapkan dari tabel distribusi, sesuai dengan probabilitas menerima hipotesis nol dan. Interval kepercayaan untuk pada yang dipilih dibuat sebagai berikut:

. (12)

Mari kita lihat sebuah contoh. Mari kita asumsikan, berdasarkan penelitian eksperimental yang ekstensif, bahwa penyebaran kandungan alkaloid suatu spesies tumbuhan dari suatu daerah tertentu sama dengan 4,37 satuan konvensional. Spesialis tersebut mempunyai sampel n = 28 tanaman tersebut, mungkin dari area yang sama. Analisis menunjukkan bahwa untuk sampel ini =5,01 dan perlu dipastikan bahwa varians ini dan varians yang diketahui sebelumnya tidak dapat dibedakan secara statistik pada tingkat signifikansi =0,1.

Menurut rumus (10) yang kita miliki

Nilai yang dihasilkan harus dibandingkan dengan nilai kritis /2=0,05 dan 1--/2=0,95. Dari tabel Lampiran untuk dengan 27 derajat kebebasan diperoleh masing-masing 40,1 dan 16,2 yang berarti hipotesis nol dapat diterima. Interval kepercayaan yang sesuai untuk adalah 3,37<<8,35.

Berbeda dengan pengujian hipotesis mengenai mean sampel dengan menggunakan uji Student, ketika kesalahan tipe pertama dan kedua tidak berubah secara signifikan ketika asumsi distribusi normal populasi dilanggar, dalam kasus hipotesis tentang varians ketika kondisi normalitas tidak terpenuhi. terpenuhi, kesalahan berubah secara signifikan.

Masalah yang dibahas di atas mengenai persamaan varians terhadap suatu nilai tetap mempunyai kepentingan yang terbatas, karena situasi yang sangat jarang terjadi ketika varians suatu populasi diketahui. Yang lebih menarik adalah kasus ketika Anda perlu memeriksa apakah varians dari dua populasi adalah sama, yaitu. menguji hipotesis terhadap alternatif. Diasumsikan bahwa sampel berukuran dan diambil secara acak dari populasi umum dengan varian dan.

Untuk menguji hipotesis nol digunakan uji rasio varians Fisher

(13)

Karena jumlah simpangan kuadrat variabel acak yang berdistribusi normal dari meannya mempunyai distribusi, maka pembilang dan penyebut (13) adalah nilai terdistribusi dibagi dengan dan masing-masing, dan oleh karena itu rasionya mempunyai distribusi F dengan -1 dan -1 derajat kebebasan.

Secara umum diterima - dan begitulah cara tabel distribusi F dibuat - bahwa varian terbesar diambil sebagai pembilang pada (13), dan oleh karena itu hanya satu titik kritis yang ditentukan, sesuai dengan tingkat signifikansi yang dipilih.

Mari kita miliki dua sampel dengan volume =11 dan =28 dari populasi keong tambak biasa dan keong lonjong, yang rasio tinggi terhadap lebarnya mempunyai varian =0,59 dan =0,38. Hipotesis tentang persamaan varians indikator-indikator tersebut perlu diuji untuk populasi yang diteliti pada tingkat signifikansi =0,05. Kita punya

Dalam literatur, terkadang Anda dapat menemukan pernyataan bahwa pengujian hipotesis tentang persamaan mean dengan menggunakan uji Student harus didahului dengan pengujian hipotesis tentang persamaan varians. Ini adalah rekomendasi yang salah. Selain itu, hal ini dapat menimbulkan kesalahan yang dapat dihindari jika tidak diikuti.

Memang hasil pengujian hipotesis persamaan varians dengan menggunakan uji Fisher sangat bergantung pada asumsi bahwa sampel diambil dari populasi yang berdistribusi normal. Pada saat yang sama, uji Student tidak sensitif terhadap pelanggaran normalitas, dan jika sampel dengan ukuran yang sama dapat diperoleh, maka asumsi persamaan varians juga tidak signifikan. Dalam kasus n yang tidak sama, rumus (7) dan (8) harus digunakan untuk verifikasi.

Saat menguji hipotesis tentang persamaan varians, beberapa fitur muncul dalam perhitungan yang terkait dengan sampel dependen. Dalam hal ini, statistik digunakan untuk menguji suatu hipotesis terhadap suatu alternatif

(14)

Jika hipotesis nol benar, maka statistik (14) memiliki distribusi t Student dengan derajat kebebasan n-2.

Saat mengukur kilap 35 sampel pelapis, diperoleh dispersi =134,5. Pengukuran berulang dua minggu kemudian menunjukkan =199,1. Dalam hal ini, koefisien korelasi antara pengukuran berpasangan ternyata sama dengan =0,876. Jika kita mengabaikan fakta bahwa sampel bergantung dan menggunakan uji Fisher untuk menguji hipotesis, kita mendapatkan F=1,48. Jika memilih tingkat signifikansi =0,05, maka hipotesis nol diterima, karena nilai kritis distribusi F untuk =35-1=34 dan =35-1=34 derajat kebebasan adalah 1,79.

Pada saat yang sama, jika kita menggunakan rumus (14) yang sesuai untuk kasus ini, kita memperoleh t = 2,35, sedangkan nilai kritis t untuk 33 derajat kebebasan dan tingkat signifikansi yang dipilih = 0,05 sama dengan 2,03. Oleh karena itu, hipotesis nol tentang varians yang sama pada kedua sampel harus ditolak. Jadi, dari contoh ini jelas bahwa, seperti dalam kasus pengujian hipotesis kesetaraan sarana, penggunaan kriteria yang tidak mempertimbangkan kekhususan data eksperimen menyebabkan kesalahan.

Dalam literatur yang direkomendasikan, Anda dapat menemukan uji Bartlett, yang digunakan untuk menguji hipotesis tentang persamaan k varians secara simultan. Selain fakta bahwa menghitung statistik kriteria ini cukup melelahkan, kelemahan utama kriteria ini adalah sangat sensitif terhadap penyimpangan dari asumsi distribusi normal populasi dari mana sampel diambil. Jadi, ketika menggunakannya, Anda tidak akan pernah bisa yakin bahwa hipotesis nol benar-benar ditolak karena variansnya berbeda secara signifikan secara statistik, dan bukan karena sampelnya tidak terdistribusi normal. Oleh karena itu, jika timbul permasalahan dalam membandingkan beberapa varians, maka perlu dicari rumusan masalah yang memungkinkan untuk menggunakan kriteria Fisher atau modifikasinya.

3 Kriteria kesepakatan mengenai saham

Seringkali kita perlu menganalisis populasi di mana objek dapat diklasifikasikan ke dalam salah satu dari dua kategori. Misalnya berdasarkan jenis kelamin pada suatu populasi tertentu, berdasarkan adanya unsur jejak tertentu di dalam tanah, berdasarkan warna gelap atau terang telur pada beberapa spesies burung, dan sebagainya.

Proporsi elemen yang mempunyai kualitas tertentu dilambangkan dengan P, dimana P mewakili rasio objek dengan kualitas yang kita minati terhadap semua objek secara agregat.

Mari kita uji hipotesis bahwa dalam suatu populasi yang cukup besar, bagian P sama dengan suatu bilangan a (0

Untuk variabel dikotomis (memiliki dua gradasi), seperti dalam kasus kami, P memainkan peran yang sama dengan rata-rata populasi variabel yang diukur secara kuantitatif. Sebaliknya, telah dinyatakan sebelumnya bahwa kesalahan baku pecahan P dapat direpresentasikan sebagai

Lalu, jika hipotesisnya benar, maka statistiknya

, (19)
dimana p adalah nilai P sampel, mempunyai satuan distribusi normal. Perlu dicatat segera bahwa perkiraan seperti itu valid jika hasil kali np atau (1-p)n yang lebih kecil lebih besar dari 5.

Perlu diketahui dari literatur bahwa pada populasi katak danau proporsi individu yang memiliki garis memanjang di punggung adalah 62% atau 0,62. Kami memiliki sampel 125 (n) individu, 93 (f) di antaranya memiliki garis memanjang di punggung. Penting untuk mengetahui apakah proporsi individu dengan sifat yang kita minati dalam populasi tempat sampel diambil sesuai dengan data yang diketahui. Kita mempunyai: p=f/n=93/125=0.744, a=0.62, n(1-p)=125(1-0.744)=32>5 dan

Oleh karena itu, baik untuk tingkat signifikansi = 0,05 dan = 0,01, hipotesis nol harus ditolak, karena nilai kritis untuk = 0,05 adalah 1,96, dan untuk = 0,01 - 2,58.

Jika terdapat dua populasi besar yang proporsi objek dengan properti yang kita minati masing-masing adalah dan, maka menarik untuk menguji hipotesis: = terhadap alternatif :. Untuk pengujian, dua sampel dengan volume dan diekstraksi secara acak dan independen. Berdasarkan sampel ini, statistik diperkirakan dan ditentukan.

(20)

dimana dan adalah banyaknya benda yang mempunyai ciri tersebut masing-masing pada sampel pertama dan kedua.

Dari rumus (20) dapat dipahami bahwa dalam penurunannya digunakan prinsip yang sama seperti yang kita jumpai sebelumnya. Yaitu, untuk menguji hipotesis statistik, ditentukan jumlah deviasi standar yang membentuk perbedaan antara indikator-indikator yang menarik bagi kami; pada kenyataannya, nilai (+)/(+) mewakili proporsi objek dengan karakteristik tertentu di keduanya sampel secara bersamaan. Jika kita menyatakannya dengan, maka ekspresi pada tanda kurung kedua penyebut (20) mewakili (1-) dan menjadi jelas bahwa ekspresi (20) ekuivalen dengan rumus untuk menguji hipotesis nol:

Karena.

Di sisi lain, ini adalah kesalahan standar. Jadi, (20) dapat ditulis sebagai

. (21)

Satu-satunya perbedaan antara statistik ini dan statistik yang digunakan dalam menguji hipotesis tentang mean adalah bahwa z mempunyai distribusi satuan normal dan bukan distribusi t.

Misalkan penelitian terhadap sekelompok orang (=82) menunjukkan bahwa proporsi orang yang mempunyai ritme - pada elektroensefalogramnya adalah 0,84 atau 84%. Sebuah penelitian terhadap sekelompok orang di daerah lain (=51) menemukan proporsi ini adalah 0,78. Untuk tingkat signifikansi =0,05, perlu diperiksa apakah proporsi individu dengan aktivitas alfa otak pada populasi umum tempat sampel diambil adalah sama.

Pertama-tama, mari kita pastikan bahwa data eksperimen yang tersedia memungkinkan kita menggunakan statistik (20). Kita punya:

dan karena z berdistribusi normal, dimana titik kritis di =0,05 adalah 1,96, maka hipotesis nol diterima.

Kriteria yang dianggap sah jika sampel yang dibandingkan adalah proporsi objek dengan karakteristik yang kita minati, bersifat independen. Jika persyaratan ini tidak terpenuhi, misalnya, ketika suatu populasi dianggap dalam interval waktu yang berurutan, maka objek yang sama mungkin memiliki karakteristik ini atau tidak dalam interval tersebut.

Mari kita nyatakan keberadaan suatu objek dari beberapa atribut yang menarik bagi kita dengan 1, dan ketidakhadirannya dengan 0. Kemudian kita sampai pada tabel 3, di mana (a+c) adalah jumlah objek dalam sampel pertama yang memiliki beberapa atribut , (a+c) adalah jumlah objek dengan karakteristik tersebut pada sampel kedua, dan n adalah jumlah total objek yang diperiksa. Jelas sekali, ini sudah merupakan tabel empat bidang yang terkenal, yang hubungannya diperkirakan menggunakan koefisien

Untuk meja seperti itu dan kecil (<10) значений в каждой клетке Р.Фишером было найдено точное распределение для, которое позволяет проверять гипотезу: =. Это распределение имеет довольно сложный вид, и его критические точки приводятся в специальных таблицах. В реальных ситуациях, как правило, значения в каждой клетке больше 10, и было показано, что в этих случаях для проверки нулевой гипотезы можно использовать статистику

(22)
yang jika hipotesis nolnya benar, mempunyai distribusi chi-kuadrat dengan satu derajat kebebasan.

Mari kita lihat sebuah contoh. Biarkan efektivitas vaksinasi malaria yang diberikan pada waktu yang berbeda dalam setahun diuji selama dua tahun. Hipotesis yang diuji adalah bahwa efektivitas vaksinasi tidak bergantung pada waktu pemberiannya. Kita punya

Nilai tabel untuk =0,05 adalah 3,84, dan untuk =0,01 adalah 6,64. Oleh karena itu, pada tingkat signifikansi mana pun, hipotesis nol harus ditolak, dan dalam contoh hipotetis ini (betapapun relevannya dengan kenyataan), dapat disimpulkan bahwa taruhan yang dibuat pada paruh kedua tahun ini jauh lebih efektif.

Generalisasi alami dari koefisien kopling untuk tabel empat bidang, seperti disebutkan sebelumnya, adalah koefisien konjugasi timbal balik Chuprov. Distribusi pasti dari koefisien ini tidak diketahui, sehingga validitas hipotesis dinilai dengan membandingkan nilai yang dihitung dan tingkat signifikansi yang dipilih dengan titik kritis untuk distribusi ini. Banyaknya derajat kebebasan ditentukan dari persamaan (r-1)(c-1), dimana r dan c adalah banyaknya gradasi untuk masing-masing karakteristik.

Mari kita mengingat kembali rumus perhitungannya

Data yang diperoleh dari mempelajari jangkauan penglihatan mata kanan dan kiri pada orang tanpa kelainan penglihatan disajikan. Secara konvensional, rentang ini dibagi menjadi empat kategori, dan kami tertarik pada keandalan hubungan antara rentang visual mata kiri dan kanan. Pertama, cari semua suku dalam jumlah gandanya. Untuk melakukan ini, kuadrat setiap nilai yang diberikan dalam tabel dibagi dengan jumlah baris dan kolom tempat nomor yang dipilih berada. Kita punya

Dengan menggunakan nilai ini kita mendapatkan =3303,6 dan T=0,714.

4 Kriteria untuk membandingkan sebaran penduduk

Dalam percobaan pemuliaan kacang polong klasik yang menandai dimulainya genetika, G. Mendel mengamati frekuensi berbagai jenis benih yang diperoleh dengan menyilangkan tanaman berbiji kuning bulat dan berbiji hijau keriput.

Dalam kasus ini dan kasus serupa, penting untuk menguji hipotesis nol tentang kesetaraan fungsi distribusi populasi umum dari mana sampel diambil, yaitu. Perhitungan teoritis menunjukkan bahwa statistik dapat digunakan untuk memecahkan masalah seperti itu

= (23)

Kriteria yang menggunakan statistik ini diusulkan oleh K. Pearson dan menyandang namanya. Uji Pearson digunakan untuk data yang dikelompokkan terlepas dari apakah data tersebut mempunyai distribusi kontinu atau diskrit. Pada (23), k adalah banyaknya interval pengelompokan, merupakan bilangan empiris, dan merupakan bilangan yang diharapkan atau teoritis (=n). Jika hipotesis nol benar, statistik (23) mempunyai distribusi dengan derajat kebebasan k-1.

Untuk data yang diberikan dalam tabel

Titik kritis distribusi dengan 3 derajat kebebasan =0,05 dan =0,01 masing-masing sama dengan 7,81 dan 11,3. Oleh karena itu, hipotesis nol diterima dan ditarik kesimpulan bahwa segregasi pada keturunannya cukup sesuai dengan pola teoretis.

Mari kita lihat contoh lainnya. Dalam satu koloni babi guinea, diperoleh jumlah kelahiran babi jantan dari tahun ke bulan, mulai bulan Januari, sebagai berikut: 65, 64, 65, 41, 72, 80, 88, 114, 80, 129, 112, 99. Bisakah kami menganggap bahwa data yang diperoleh sesuai dengan distribusi yang seragam, yaitu. distribusi rata-rata jumlah kelahiran laki-laki pada setiap bulan adalah sama? Jika kita menerima hipotesis ini, maka perkiraan jumlah rata-rata kelahiran bayi laki-laki akan sama. Kemudian

Nilai kritis suatu distribusi dengan 11 derajat kebebasan dan = 0,01 adalah 24,7, sehingga pada tingkat signifikansi yang dipilih hipotesis nol ditolak. Analisis lebih lanjut terhadap data eksperimen menunjukkan bahwa kemungkinan lahirnya marmot jantan pada paruh kedua tahun ini meningkat.

Dalam kasus di mana distribusi teoretis diasumsikan seragam, tidak ada masalah dalam menghitung bilangan teoretis. Dalam kasus distribusi lain, perhitungannya menjadi lebih rumit. Mari kita lihat contoh bagaimana bilangan teoritis dihitung untuk distribusi normal dan Poisson, yang cukup umum dalam praktik penelitian.

Mari kita mulai dengan menentukan bilangan teoritis untuk distribusi normal. Idenya adalah untuk mengubah distribusi empiris kita menjadi distribusi dengan mean dan varian satuan nol. Secara alami, dalam hal ini, batas-batas interval kelas akan dinyatakan dalam satuan simpangan baku, dan kemudian, mengingat luas di bawah bagian kurva yang dibatasi oleh nilai atas dan bawah setiap interval sama dengan probabilitas jatuh ke dalam interval tertentu, mengalikan probabilitas ini dengan jumlah total pengambilan sampel, kita akan memperoleh angka teoritis yang diinginkan.

Misalkan kita mempunyai distribusi empiris untuk panjang daun ek dan kita perlu memeriksa apakah dengan tingkat signifikansi =0,05 dapat dianggap bahwa distribusi ini tidak berbeda secara signifikan dari normal.

Mari kita jelaskan bagaimana nilai yang diberikan dalam tabel dihitung. Pertama, dengan menggunakan metode standar untuk data yang dikelompokkan, dihitung mean dan deviasi standar, yang ternyata sama dengan =10,3 dan =2,67. Dengan menggunakan nilai-nilai ini, batas-batas interval ditemukan dalam satuan standar deviasi, yaitu. nilai standar telah ditemukan, misalnya untuk batas interval (46) kita mempunyai: (4-10.3)/2.67=-2.36; (6-10.3)/2.67=-1.61. Kemudian, untuk setiap interval, probabilitas jatuh ke dalamnya dihitung. Misalnya, untuk interval (-0,110,64) dari tabel distribusi normal, kita mendapatkan bahwa di sebelah kiri titik (-0,11) terdapat 0,444 luas satuan distribusi normal, dan di sebelah kiri dari titik (0,64) ada 0,739 dari luas tersebut. Jadi, peluang jatuh ke dalam interval ini adalah 0,739-0,444=0,295. Perhitungan selanjutnya sudah jelas. Perbedaan antara n dan... harus dijelaskan. Hal ini muncul karena fakta bahwa distribusi normal teoretis dapat dianggap, untuk tujuan praktis, berpusat pada suatu interval. Dalam percobaan, tidak ada nilai yang menyimpang lebih dari rata-rata. Oleh karena itu, luas daerah di bawah kurva distribusi empiris tidak sama dengan satu sehingga timbul kesalahan. Namun kesalahan ini tidak mengubah hasil akhir secara signifikan.

Saat membandingkan distribusi empiris dan teoritis, jumlah derajat kebebasan untuk -distribusi ditemukan dari hubungan f=m-1-l, di mana m adalah jumlah interval kelas, dan l adalah jumlah parameter distribusi independen yang diperkirakan dari contoh. Untuk distribusi normal aku=2, karena bergantung pada dua parameter: dan.

Jumlah derajat kebebasan juga berkurang 1, karena untuk setiap distribusi ada syarat =1, yang berarti jumlah probabilitas yang ditentukan secara independen sama dengan k-1, bukan k.

Untuk contoh yang diberikan, f = 8-2-1 = 5 dan nilai kritis pada =0,05 untuk distribusi - dengan 5 derajat kebebasan adalah 11,07. Oleh karena itu, hipotesis nol diterima.

Mari kita perhatikan teknik membandingkan distribusi empiris dengan distribusi Poisson menggunakan contoh klasik jumlah kematian naga per bulan di tentara Prusia akibat kuku kuda. Datanya berasal dari abad ke-19, dan jumlah kematiannya adalah 0, 1, 2, dst. mencirikan peristiwa menyedihkan namun untungnya relatif jarang terjadi di kavaleri Prusia selama hampir 20 tahun pengamatan.

Seperti diketahui, distribusi Poisson mempunyai bentuk sebagai berikut:

dimana parameter distribusi sama dengan rata-rata,

K =0,1,2,...,n.

Karena distribusinya diskrit, probabilitas yang kita minati ditemukan langsung dari rumusnya.

Mari kita tunjukkan, misalnya, bagaimana bilangan teoretis untuk k=3 ditentukan. Biasanya kita menemukan bahwa mean dalam distribusi ini adalah 0,652. Mengingat nilai ini, kami menemukannya

Dari sini

Jika yang dipilih =0,05, maka nilai kritis distribusi - dengan dua derajat kebebasan adalah 5,99, sehingga hipotesis bahwa distribusi empiris pada tingkat signifikansi yang dipilih tidak berbeda dengan distribusi Poisson diterima. Banyaknya derajat kebebasan dalam hal ini adalah dua, karena distribusi Poisson bergantung pada satu parameter, sehingga pada relasi f = m-1-l, jumlah parameter yang diestimasi dari sampel adalah l = 1, dan f = 4-1-1 = 2.

Terkadang dalam praktiknya, penting untuk mengetahui apakah dua distribusi berbeda satu sama lain, meskipun sulit untuk memutuskan distribusi teoretis mana yang dapat mendekatinya. Hal ini sangat penting terutama dalam kasus di mana, misalnya, rata-rata dan/atau variansnya tidak berbeda secara signifikan satu sama lain. Menemukan perbedaan yang signifikan dalam pola distribusi dapat membantu peneliti membuat prediksi tentang faktor-faktor yang mungkin menyebabkan perbedaan tersebut.

Dalam hal ini, statistik (23) dapat digunakan, dan nilai suatu distribusi digunakan sebagai besaran empiris, dan nilai distribusi lainnya sebagai nilai teoritis. Tentu saja, dalam hal ini, pembagian ke dalam interval kelas harus sama untuk kedua distribusi. Ini berarti bahwa untuk semua data dari kedua sampel, nilai minimum dan maksimum dipilih, terlepas dari sampel mana mereka berasal, dan kemudian, sesuai dengan jumlah interval kelas yang dipilih, lebarnya ditentukan dan jumlah objeknya ditentukan. jatuh ke dalam interval terpisah dihitung untuk setiap sampel secara terpisah.

Dalam hal ini, mungkin saja beberapa kelas tidak memuat atau hanya sedikit (35) nilai yang termasuk di dalamnya. Penggunaan kriteria Pearson memberikan hasil yang memuaskan jika setidaknya 35 nilai masuk dalam setiap interval. Oleh karena itu, jika persyaratan ini tidak terpenuhi, interval yang berdekatan harus digabungkan. Tentu saja hal ini dilakukan untuk kedua distro tersebut.

Dan terakhir, satu catatan lagi mengenai perbandingan nilai yang dihitung dan titik kritisnya pada tingkat signifikansi yang dipilih. Kita telah mengetahui bahwa jika >, maka hipotesis nol ditolak. Namun nilai yang mendekati titik kritis 1- di sebelah kanan patut menimbulkan kecurigaan kita, karena kebetulan yang terlalu bagus antara distribusi empiris dan teoritis atau dua distribusi empiris (bagaimanapun juga, dalam hal ini angkanya akan sedikit berbeda dari satu sama lain) tidak mungkin terjadi untuk distribusi acak. Dalam hal ini, ada dua penjelasan alternatif yang mungkin: apakah kita berhadapan dengan suatu hukum, dan kemudian hasil yang diperoleh tidak mengejutkan, atau data eksperimen, karena alasan tertentu, “disesuaikan” satu sama lain, sehingga memerlukan verifikasi ulang. .

Omong-omong, dalam contoh kacang polong kita memiliki kasus pertama, yaitu. Munculnya benih-benih yang berbeda kehalusan dan warna pada keturunannya ditentukan oleh hukum, oleh karena itu tidak mengherankan jika nilai yang dihitung ternyata sangat kecil.

Sekarang mari kita kembali menguji hipotesis statistik tentang identitas dua distribusi empiris. Disajikan data sebaran jumlah kelopak bunga anemon yang diambil dari habitat berbeda.

Dari data tabel terlihat jelas bahwa dua interval pertama dan dua interval terakhir harus digabungkan, karena jumlah nilai yang termasuk di dalamnya tidak cukup untuk penggunaan kriteria Pearson yang benar. Dari contoh ini juga terlihat jelas bahwa jika yang dianalisis hanya sebaran dari habitat A, maka tidak akan ada interval kelas yang memuat 4 kelopak sama sekali. Hal ini muncul karena dua distribusi dianggap secara bersamaan, dan pada distribusi kedua terdapat kelas seperti itu.

Jadi, mari kita periksa hipotesis bahwa kedua distribusi ini tidak berbeda satu sama lain. Kita punya

Untuk sejumlah derajat kebebasan 4 dan tingkat signifikansi genap sama dengan 0,001, hipotesis nol ditolak.

Untuk membandingkan dua distribusi sampel, Anda juga dapat menggunakan kriteria nonparametrik yang diusulkan oleh N.V. Smirnov dan berdasarkan statistik yang diperkenalkan sebelumnya oleh A.N. Kolmogorov. (Inilah sebabnya tes ini terkadang disebut tes Kolmogorov-Smirnov.) Tes ini didasarkan pada perbandingan rangkaian frekuensi yang terakumulasi. Statistik kriteria ini ditemukan sebagai

maks, (24)
di mana dan adalah kurva distribusi frekuensi akumulasi.

Poin kritis untuk statistik (24) ditemukan dari relasi tersebut

, (25)
dimana dan adalah volume sampel pertama dan kedua.

Nilai kritis untuk =0.1;=0.05; dan =0,01 masing-masing sama dengan 1,22; 1,36; 1.63. Mari kita ilustrasikan penggunaan kriteria Smirnov dengan menggunakan data kelompok yang mewakili tinggi badan anak sekolah seumuran yang sama dari dua daerah berbeda.

Perbedaan maksimum antara kurva frekuensi akumulasi adalah 0,124. Jika kita memilih tingkat signifikansi =0,05, maka dari rumus (25) kita peroleh

0,098.

Dengan demikian, perbedaan empiris maksimum lebih besar dari yang diharapkan secara teoritis, oleh karena itu, pada tingkat signifikansi yang diterima, hipotesis nol tentang identitas dua distribusi yang dipertimbangkan ditolak.

Uji Smirnov juga dapat digunakan untuk data yang tidak berkerumun, syaratnya hanya data tersebut harus diambil dari populasi yang sebarannya kontinu. Jumlah nilai dalam setiap sampel juga diharapkan minimal 40-50.

Untuk menguji hipotesis nol, yang menyatakan bahwa dua sampel independen berukuran n dan m sesuai dengan fungsi distribusi yang sama, F. Wilcoxon mengusulkan kriteria nonparametrik, yang dibenarkan dalam karya G. Mann dan F. Whitney. Oleh karena itu, dalam literatur kriteria ini disebut kriteria Wilcoxon atau kriteria Mann-Whitney. Kriteria ini disarankan untuk digunakan ketika ukuran sampel yang diperoleh kecil dan penggunaan kriteria lain tidak tepat.

Perhitungan di bawah ini mengilustrasikan pendekatan untuk membangun kriteria yang menggunakan statistik yang tidak terkait dengan nilai sampel itu sendiri, tetapi dengan peringkatnya.

Mari kita memiliki dua sampel dengan ukuran nilai n dan m. Mari kita buat deret variasi umum darinya, dan bandingkan masing-masing nilai ini dengan peringkatnya (), yaitu. nomor seri yang ditempatinya dalam seri peringkat. Jika hipotesis nol benar, maka distribusi peringkat mana pun memiliki kemungkinan yang sama, dan jumlah total kemungkinan kombinasi peringkat untuk n dan m tertentu sama dengan jumlah kombinasi elemen N=n+m dengan m.

Tes Wilcoxon didasarkan pada statistik

. (26)

Secara formal, untuk menguji hipotesis nol, perlu untuk menghitung semua kemungkinan kombinasi peringkat yang statistik W-nya mengambil nilai yang sama dengan atau kurang dari yang diperoleh untuk rangkaian peringkat tertentu, dan menemukan rasio angka ini terhadap total jumlah kemungkinan kombinasi peringkat untuk kedua sampel. Membandingkan nilai yang diperoleh dengan tingkat signifikansi yang dipilih akan memungkinkan Anda menerima atau menolak hipotesis nol. Alasan dibalik pendekatan ini adalah jika suatu distribusi bias dibandingkan dengan distribusi lainnya, maka hal ini akan terwujud dalam kenyataan bahwa peringkat yang kecil harusnya berhubungan terutama dengan satu sampel, dan peringkat yang besar dengan sampel yang lain. Tergantung pada hal ini, jumlah peringkat yang sesuai harus kecil atau besar tergantung pada alternatif mana yang muncul.

Perlu dilakukan pengujian hipotesis tentang identitas fungsi distribusi yang mencirikan kedua metode pengukuran dengan tingkat signifikansi =0,05.

Dalam contoh ini n = 3, m = 2, N = 2+3 = 5, dan jumlah rangking yang diukur menggunakan metode B adalah 1+3 = 4.

Mari kita tuliskan semua =10 kemungkinan distribusi peringkat dan jumlahnya:

Peringkat: 1.2 1.3 1.4 1.5 2.3 2.4 2.5 3.4 3.5 4.5

Jumlah: 3 4 5 6 5 6 7 7 8 9

Rasio jumlah kombinasi peringkat, yang jumlahnya tidak melebihi nilai yang diperoleh 4 untuk metode B, terhadap jumlah total kemungkinan kombinasi peringkat adalah 2/10=0,2>0,05, jadi untuk contoh ini hipotesis nolnya adalah diterima.

Untuk nilai n dan m yang kecil, hipotesis nol dapat diuji dengan menghitung langsung jumlah kombinasi jumlah peringkat yang sesuai. Namun, untuk sampel besar hal ini praktis tidak mungkin dilakukan, sehingga diperoleh perkiraan untuk statistik W, yang ternyata cenderung asimtotik ke distribusi normal dengan parameter yang sesuai. Kami akan menghitung parameter ini untuk mengilustrasikan pendekatan dalam mensintesis uji statistik berbasis peringkat. Untuk melakukannya, kami akan menggunakan hasil yang disajikan pada Bab 37.

Misalkan W adalah jumlah rangking yang bersesuaian dengan salah satu sampel, misalnya sampel yang bervolume m. Biarkan menjadi rata-rata aritmatika dari peringkat ini. Ekspektasi matematis dari nilainya adalah

karena berdasarkan hipotesis nol, peringkat elemen dalam sampel berukuran m mewakili sampel dari populasi terbatas 1, 2,...,N (N=n+m). Diketahui bahwa

Itu sebabnya.

Saat menghitung varians, kami memanfaatkan fakta bahwa jumlah kuadrat rangking dari rangkaian peringkat umum, yang terdiri dari nilai kedua sampel, sama dengan

Dengan mempertimbangkan hubungan yang diperoleh sebelumnya untuk memperkirakan varians populasi umum dan sampel, kita punya

Oleh karena itu

Statistik telah menunjukkan hal itu

(27)

untuk n dan m yang besar mempunyai distribusi normal satuan asimtotik.

Mari kita lihat sebuah contoh. Biarkan data aktivitas polarografi filtrat serum darah diperoleh untuk dua kelompok umur. Perlu dilakukan uji hipotesis dengan tingkat signifikansi =0,05 bahwa sampel diambil dari populasi umum yang mempunyai fungsi distribusi yang sama. Jumlah rangking untuk sampel pertama adalah 30, untuk sampel kedua - 90. Pengecekan kebenaran penghitungan jumlah rangking merupakan pemenuhan syarat. Dalam kasus kita, 30+90=(7+8)(7+8+1):

:2=120. Menurut rumus (27), dengan menggunakan jumlah peringkat sampel kedua, kita peroleh

Jika kita menggunakan jumlah rank untuk sampel pertama, kita mendapatkan nilai = -3,01. Karena statistik yang dihitung memiliki distribusi satuan normal, wajar jika hipotesis nol ditolak dalam kasus pertama dan kedua, karena nilai kritis untuk tingkat signifikansi 5% adalah modulo 1,96.

Saat menggunakan uji Wilcoxon, kesulitan tertentu muncul ketika ditemukan nilai yang sama pada kedua sampel, karena penggunaan rumus di atas menyebabkan penurunan kekuatan pengujian, terkadang sangat signifikan.

Untuk mengurangi kesalahan seminimal mungkin dalam kasus seperti ini, disarankan untuk menggunakan aturan praktis berikut. Pertama kali ketika nilai-nilai identik dari sampel yang berbeda ditemukan, nilai mana yang didahulukan dalam rangkaian variasi ditentukan secara acak, misalnya dengan melempar koin. Jika ada beberapa nilai seperti itu, maka, setelah menentukan nilai pertama secara kebetulan, sisa nilai yang sama dari kedua sampel diselingi. Jika ditemukan nilai lain yang setara, lakukan ini. Jika pada kelompok pertama yang bernilai sama nilai pertama dipilih secara acak dari satu sampel tertentu, maka pada kelompok berikutnya yang bernilai sama dipilih terlebih dahulu nilai dari sampel lain, dan seterusnya.

5.Kriteria untuk memeriksa keacakan dan mengevaluasi observasi outlier

Seringkali, data diperoleh secara seri melintasi ruang dan waktu. Misalnya, dalam proses melakukan eksperimen psikofisiologis, yang dapat berlangsung beberapa jam, beberapa puluh atau ratusan kali, reaksi laten (periode laten) terhadap stimulus visual yang disajikan diukur, atau dalam survei geografis, ketika berada di lokasi. di tempat-tempat tertentu, misalnya di sepanjang tepi hutan, dihitung jumlah tumbuhan suatu jenis tertentu, dan sebagainya. Di sisi lain, ketika menghitung berbagai statistik, diasumsikan bahwa sumber data bersifat independen dan terdistribusi secara identik. Oleh karena itu, menarik untuk menguji asumsi ini.

Pertama, pertimbangkan kriteria untuk menguji hipotesis nol tentang independensi nilai-nilai yang terdistribusi normal secara identik. Jadi, kriteria ini bersifat parametrik. Hal ini didasarkan pada penghitungan kuadrat rata-rata dari perbedaan yang berurutan

. (28)

Jika kita memperkenalkan statistik baru, maka, seperti diketahui dari teori, jika hipotesis nol benar, maka statistiklah

(29)
untuk n>10 berdistribusi asimtotik menurut distribusi normal baku.

Mari kita lihat sebuah contoh. Waktu reaksi () subjek dalam salah satu eksperimen psikofisiologis diberikan.

Kami punya: dari mana

Karena =0,05 nilai kritisnya adalah 1,96, hipotesis nol tentang independensi rangkaian yang dihasilkan diterima dengan tingkat signifikansi yang dipilih.

Pertanyaan lain yang sering muncul ketika menganalisis data eksperimen adalah apa yang harus dilakukan dengan beberapa observasi yang sangat berbeda dari sebagian besar observasi. Pengamatan outlier tersebut dapat terjadi karena kesalahan metodologi, kesalahan perhitungan, dan lain-lain. Dalam semua kasus di mana pelaku eksperimen mengetahui bahwa kesalahan telah menyusup ke dalam pengamatan, ia harus mengecualikan nilai ini, berapa pun besarnya. Dalam kasus lain, hanya ada kecurigaan adanya kesalahan, dan kemudian perlu menggunakan kriteria yang tepat untuk mengambil keputusan tertentu, yaitu. mengecualikan atau meninggalkan observasi outlier.

Secara umum pertanyaan yang diajukan adalah sebagai berikut: apakah pengamatan dilakukan pada populasi yang sama, atau apakah beberapa bagian atau nilai individu dimiliki oleh populasi yang berbeda?

Tentu saja, satu-satunya cara yang dapat diandalkan untuk mengecualikan pengamatan individu adalah dengan mempelajari secara cermat kondisi di mana pengamatan tersebut diperoleh. Jika karena alasan tertentu kondisinya berbeda dari kondisi standar, maka observasi tersebut harus dikeluarkan dari analisis lebih lanjut. Namun dalam kasus tertentu, kriteria yang ada, meskipun tidak sempurna, dapat memberikan manfaat yang signifikan.

Di sini kami akan menyajikan, tanpa bukti, beberapa hubungan yang dapat digunakan untuk menguji hipotesis bahwa pengamatan dilakukan secara kebetulan pada populasi yang sama. Kita punya

(30)

(31)

(32)

di mana dugaan observasi “outlier”. Jika semua nilai suatu deret diurutkan, maka observasi yang paling menonjol di dalamnya akan menempati peringkat ke-n.

Untuk statistik (30), fungsi distribusi ditabulasikan. Titik kritis distribusi ini untuk beberapa n diberikan.

Nilai kritis untuk statistik (31) bergantung pada n adalah

4,0; 6

4,5; 100

5.0; n>1000.

Rumus (31) mengasumsikan demikian dan dihitung tanpa memperhitungkan dugaan observasi.

Dengan statistik (32), situasinya menjadi lebih rumit. Terlihat bahwa jika terdistribusi secara merata, maka ekspektasi dan varians matematisnya berbentuk:

Daerah kritis dibentuk oleh nilai-nilai kecil yang bersesuaian dengan nilai-nilai besar. Jika Anda tertarik untuk memeriksa “outlier” dengan nilai terkecil, maka transformasikan terlebih dahulu datanya agar memiliki distribusi yang seragam pada interval tersebut, lalu tambahkan nilai seragam tersebut menjadi 1 dan periksa menggunakan rumus ( 32).

Pertimbangkan untuk menggunakan kriteria di atas untuk rangkaian observasi berperingkat berikut: 3,4,5,5,6,7,8,9,9,10,11,17. Anda perlu memutuskan apakah nilai tertinggi 17 harus ditolak.

Kita mempunyai: Menurut rumus (30) =(17-11)/3,81=1,57, dan hipotesis nol harus diterima pada =0,01. Menurut rumus (31) = (17-7.0)/2.61 = 3.83, maka hipotesis nol juga harus diterima. Untuk menggunakan kriteria ketiga, kita cari =5,53, maka

Statistik w berdistribusi normal dengan mean dan varian satuan nol, sehingga hipotesis nol pada =0,05 diterima.

Kesulitan dalam menggunakan statistik (32) adalah kebutuhan untuk memiliki informasi apriori tentang hukum distribusi nilai sampel, dan kemudian secara analitis mengubah distribusi ini menjadi distribusi seragam sepanjang interval.

literatur

1. Eliseeva I.I. Teori umum statistika: buku teks untuk universitas / I.I. Eliseeva, M.M. Yuzbashev; diedit oleh aku. Eliseeva. M.: Keuangan dan Statistik, 2009. 656 hal.

2. Efimova M.R. Workshop Teori Umum Statistika: Buku Ajar untuk Perguruan Tinggi / M.R. Efimova dan lain-lain M.: Keuangan dan Statistik, 2007. 368 hal.

3. Melkumov Y.S. Statistik sosial-ekonomi: manual pendidikan dan metodologi. M.: IMPE-PUBLISH, 2007. 200 hal.

4. Teori umum statistik: Metodologi statistik dalam studi aktivitas komersial: buku teks untuk universitas / O.E. Bashina dan lainnya; diedit oleh O.E. Bashina, A.A. Spirina. - M.: Keuangan dan Statistik, 2008. 440 hal.

5. Salin V.N. Kursus teori statistik untuk melatih spesialis dalam profil keuangan dan ekonomi: buku teks / V.N. Salin, E.Yu. Churilova. M.: Keuangan dan Statistik, 2007. 480 hal.

6. Statistik sosial ekonomi: lokakarya: buku teks / V.N. Salin dkk.; diedit oleh V.N. Salina, EP. Shpakovsky. M.: Keuangan dan Statistik, 2009. 192 hal.

7. Statistika: buku teks / A.V. Bagat dkk.; diedit oleh V.M. Simcher. M.: Keuangan dan Statistik, 2007. 368 hal.

8. Statistika: buku teks / I.I. Eliseeva dan lainnya; diedit oleh aku. Eliseeva. M.: Perguruan Tinggi, 2008. - 566 hal.

9. Teori Statistika: Buku Ajar untuk Perguruan Tinggi / R.A. Shmoilova dan lainnya; diedit oleh R.A. Shmoilova. - M.: Keuangan dan Statistik, 2007. 656 hal.

10. Shmoilova R.A. Workshop Teori Statistika: Buku Ajar Perguruan Tinggi / R.A. Shmoilova dan lainnya; diedit oleh R.A. Shmoilova. - M.: Keuangan dan Statistik, 2007. 416 hal.

HALAMAN \* MERGEFORMAT 1

Karya serupa lainnya yang mungkin menarik bagi Anda.vshm>

17926. Analisis kriteria kekompakan robotika industri 1,77MB
Solusi perangkat lunak untuk menilai kekompakan robot. Miniatur robot dapat menembus dan bergerak melalui bukaan sempit, sehingga dapat digunakan untuk melakukan berbagai tugas di ruang terbatas, seperti pipa berdiameter kecil berukuran beberapa milimeter. Di hampir semua industri, isu miniaturisasi aktuator dan mekanisme menjadi salah satu prioritas; mereka sangat penting untuk proses teknologi sumber daya rendah...
1884. Pengembangan kriteria manajemen personalia yang efektif di OJSC Kazan-Orgsintez untuk SMM 204,77 KB
Aspek teoritis dasar dari sistem manajemen personalia. Personil sebagai objek manajemen. Metode penelitian sistem manajemen personalia untuk QMS. Cara untuk meningkatkan efisiensi manajemen personalia.
16316. dan teori ini menyelesaikan dilema ini; b penyelesaian dilema ini memerlukan adanya kriteria teori ini. 12,12 KB
Penulis berpendapat bahwa alasan mendasar terjadinya dilema kebijakan makroekonomi dalam kondisi nilai tukar tetap bukanlah pelanggaran terhadap aturan Tinbergen, yang sebenarnya merupakan konsekuensi dan bukan penyebab, melainkan tidak adanya prasyarat ekonomi yang diperlukan untuk memperbaiki nilai tukar. kurs seperti yang disajikan dalam teori zona mata uang optimal. Penyebab dilema ini biasanya dianggap sebagai pelanggaran terhadap aturan Tinbergen, yang menyatakan bahwa untuk mencapai sejumlah tujuan ekonomi tertentu, negara harus...
18273. Analisis status hukum Presiden Republik Kazakhstan dari sudut pandang kriteria supremasi hukum yang diterima secara umum dan prinsip pemisahan kekuasaan 73,64 KB
Inti dari pendekatan Presiden adalah bahwa negara harus berkembang secara alami dan evolusioner. Pemerintahan presiden - diatur oleh Konstitusi negara, ini adalah penghentian kegiatan lembaga-lembaga pemerintahan sendiri dari suatu entitas administratif daerah tertentu dan pelaksanaan pengelolaan yang terakhir melalui orang-orang yang berwenang yang ditunjuk oleh kepala negara - presiden dan orang-orang yang bertanggung jawab kepadanya; diatur oleh Konstitusi, pemberian kekuasaan darurat kepada kepala negara - presiden - dalam skala global...
5713. Menggunakan DotNetNuke 1,87MB
Dalam kursus ini kita akan mempelajari DotNetNuke. DotNetNuke (disingkat nama DNN) adalah sistem manajemen konten situs web (Web Content Management System, disingkat WCMS), yang telah menyerap semua pencapaian terbaik di bidang teknologi untuk membangun proyek web.
7073. MENGGUNAKAN ANTARMUKA 56,59 KB
Kata antarmuka adalah kata polisemantik, dan memiliki arti berbeda dalam konteks berbeda. Ada konsep antarmuka perangkat lunak atau perangkat keras, tetapi dalam banyak kasus, kata antarmuka dikaitkan dengan semacam hubungan antara objek atau proses.
6471. Daftar struktur dan penggunaan 193,04 KB
Struktur dan penggunaan register Register dirancang untuk menyimpan dan mengkonversi bilangan biner multi-bit. Register dibangun sebagai rangkaian flip-flop yang terurut. Dalam mikroprosesor, register adalah sarana utama untuk mengingat dan menyimpan informasi digital dengan cepat. Elemen dari mana register dibangun adalah sandal jepit D RS JK dengan pemutusan pulsa dinamis atau kontrol statis.
6472. Struktur dan penggunaan penghitung 318,58 KB
Klasifikasi dan prinsip konstruksi pencacah asinkron Pencacah adalah perangkat yang keluarannya membentuk kode biner yang menyatakan jumlah pulsa yang diterima pada masukan pencacah. Jumlah kemungkinan keadaan suatu pencacah disebut modulus atau koefisien pencacahan dan dinyatakan. Karakteristik waktu utama penghitung: frekuensi kedatangan maksimum pulsa penghitung; waktu peralihan dari satu keadaan ke keadaan lain; Ada sirkuit mikro penghitung itu sendiri dan sirkuit yang dibangun berdasarkan satu atau lebih...
7066. MENGGUNAKAN MENU DALAM APLIKASI 240,2 KB
Menu program Menu program harus sesuai dengan mode pengoperasian utama program, oleh karena itu, pemilihan item menu dan perintah masing-masing item harus dilakukan dengan sangat hati-hati. Untuk lebih memahami teknologi penggunaan menu dalam program, perhatikan urutan tindakan saat menyelesaikan program pelatihan berikut. Semua tindakan harus diselesaikan menggunakan menu.
7067. MENGGUNAKAN MENU DIALOG 73,13 KB
Melanjutkan pengembangan aplikasi dengan menu dan toolbar, kita perlu menulis kode untuk penangan pesan untuk perintah untuk membuat matriks 6*6 dan mengeluarkan (mencetak) matriks tersebut ke area klien aplikasi kita. Pembuatan matriks harus diselesaikan dengan menampilkan pesan di layar yang menunjukkan keberhasilan penyelesaian pengendali, misalnya, “Matriks telah dibuat.”

Perkenalan

Relevansi topik ini adalah ketika mempelajari dasar-dasar biostatistik, kita berasumsi bahwa hukum persebaran penduduk telah diketahui. Tetapi bagaimana jika hukum distribusinya tidak diketahui, tetapi ada alasan untuk berasumsi bahwa ia mempunyai bentuk tertentu (sebut saja A), maka hipotesis nol diuji: populasi tersebar menurut hukum A. Hipotesis ini diuji dengan menggunakan a variabel acak yang dipilih secara khusus - kriteria kesesuaian.

Kriteria goodness-of-fit adalah kriteria untuk menguji hipotesis tentang kesesuaian distribusi empiris dengan distribusi probabilitas teoritis. Kriteria tersebut dibagi menjadi dua kelas:

  • III Uji goodness-of-fit umum diterapkan pada rumusan hipotesis yang paling umum, yaitu hipotesis bahwa hasil observasi sesuai dengan distribusi probabilitas yang diasumsikan secara a priori.
  • Ш Uji kesesuaian khusus melibatkan hipotesis nol khusus yang merumuskan kesesuaian dengan bentuk distribusi probabilitas tertentu.

Kriteria kesepakatan

Tes kesesuaian yang paling umum adalah omega-square, chi-square, Kolmogorov, dan Kolmogorov-Smirnov.

Tes kesesuaian nonparametrik Kolmogorov, Smirnov, dan omega square banyak digunakan. Namun, hal ini juga terkait dengan kesalahan yang meluas dalam penerapan metode statistik.

Faktanya adalah bahwa kriteria yang terdaftar dikembangkan untuk menguji kesesuaian dengan distribusi teoritis yang diketahui sepenuhnya. Rumus perhitungan, tabel distribusi dan nilai kritis banyak digunakan. Ide utama dari Kolmogorov, omega square dan tes serupa adalah untuk mengukur jarak antara fungsi distribusi empiris dan fungsi distribusi teoritis. Kriteria ini berbeda dalam jenis jarak dalam ruang fungsi distribusi.

Tes kesesuaian Pearson untuk hipotesis sederhana

Teorema K. Pearson berlaku untuk uji coba independen dengan jumlah hasil yang terbatas, yaitu. untuk tes Bernoulli (dalam arti yang sedikit diperluas). Hal ini memungkinkan kita untuk menilai apakah pengamatan pada sejumlah besar percobaan terhadap frekuensi hasil ini konsisten dengan estimasi probabilitasnya.

Dalam banyak permasalahan praktis, hukum distribusi pastinya tidak diketahui. Oleh karena itu, diajukan hipotesis tentang kesesuaian hukum empiris yang ada, yang dibangun dari observasi, dengan hukum teoritis tertentu. Hipotesis ini memerlukan pengujian statistik, yang hasilnya akan terkonfirmasi atau terbantahkan.

Misalkan X adalah variabel acak yang diteliti. Hipotesis H0 harus diuji bahwa variabel acak ini mematuhi hukum distribusi F(x). Untuk melakukan ini, perlu membuat sampel dari n observasi independen dan menggunakannya untuk membangun hukum distribusi empiris F "(x). Untuk membandingkan hukum empiris dan hipotetis, digunakan aturan yang disebut kriteria goodness-of-fit. Salah satu yang populer adalah uji kesesuaian chi-kuadrat K. Pearson, yang mana statistik chi-kuadrat dihitung:

di mana N adalah jumlah interval yang sesuai dengan hukum distribusi empiris yang dibangun (jumlah kolom histogram yang sesuai), i adalah jumlah interval, pt i adalah probabilitas nilai variabel acak jatuh ke dalam i- interval ke-i untuk hukum distribusi teoritis, pe i adalah probabilitas nilai variabel acak yang berada pada interval ke-i untuk hukum distribusi empiris. Itu harus mematuhi distribusi chi-kuadrat.

Jika nilai statistik yang dihitung melebihi kuantil distribusi chi-kuadrat dengan derajat kebebasan k-p-1 untuk tingkat signifikansi tertentu, maka hipotesis H0 ditolak. Jika tidak, maka diterima pada tingkat signifikansi yang ditentukan. Di sini k adalah jumlah observasi, p adalah jumlah parameter estimasi hukum distribusi.

Mari kita lihat statistiknya:

Statistik h2 disebut statistik chi-kuadrat Pearson untuk hipotesis sederhana.

Jelas bahwa h2 mewakili kuadrat jarak tertentu antara dua vektor berdimensi r: vektor frekuensi relatif (mi /n, ..., mr /n) dan vektor probabilitas (pi, ..., pr ). Jarak ini berbeda dengan jarak Euclidean hanya pada koordinat yang berbeda yang memasukkannya dengan bobot yang berbeda.

Mari kita bahas perilaku statistik h2 jika hipotesis H benar dan jika H salah. Jika H benar, maka perilaku asimtotik h2 untuk n > ? menunjukkan teorema K. Pearson. Untuk memahami apa yang terjadi pada (2.2) jika H salah, perhatikan bahwa menurut hukum bilangan besar mi /n > pi untuk n > ?, untuk i = 1, …, r. Oleh karena itu, untuk n > ?:

Nilai ini sama dengan 0. Oleh karena itu, jika H salah, maka h2 >? (untuk n > ?).

Dari penjelasan di atas maka H harus ditolak jika nilai h2 yang diperoleh pada percobaan terlalu besar. Di sini, seperti biasa, kata “terlalu besar” berarti bahwa nilai h2 yang diamati melebihi nilai kritis, yang dalam hal ini dapat diambil dari tabel distribusi chi-kuadrat. Dengan kata lain, probabilitas P(ch2 npi h2) adalah nilai yang kecil dan, oleh karena itu, kecil kemungkinannya untuk secara tidak sengaja memperoleh nilai yang sama seperti dalam eksperimen, atau bahkan perbedaan yang lebih besar antara vektor frekuensi dan vektor probabilitas.

Sifat asimtotik dari teorema K. Pearson, yang mendasari aturan ini, memerlukan kehati-hatian dalam penggunaan praktisnya. Hanya bisa diandalkan untuk n besar. Penting untuk menilai apakah n cukup besar dengan mempertimbangkan probabilitas pi, ..., pr. Oleh karena itu, tidak dapat dikatakan, misalnya, bahwa seratus pengamatan akan cukup, karena tidak hanya n yang harus besar, tetapi hasil kali npi , ..., npr (frekuensi yang diharapkan) juga tidak boleh kecil. Oleh karena itu, masalah memperkirakan h2 (distribusi kontinu) ke statistik h2, yang distribusinya diskrit, ternyata sulit. Kombinasi argumen teoritis dan eksperimental telah menghasilkan keyakinan bahwa perkiraan ini dapat diterapkan jika semua frekuensi yang diharapkan npi>10. jika angka r (banyaknya hasil yang berbeda) bertambah, batasnya dikurangi (menjadi 5 atau bahkan menjadi 3 jika r berorde beberapa puluh). Untuk memenuhi persyaratan ini, dalam praktiknya terkadang perlu menggabungkan beberapa hasil, yaitu. beralih ke skema Bernoulli dengan r lebih kecil.

Metode yang dijelaskan untuk memeriksa kesesuaian dapat diterapkan tidak hanya pada uji Bernoulli, tetapi juga pada sampel acak. Pertama, pengamatan mereka harus diubah menjadi tes Bernoulli dengan mengelompokkan. Mereka melakukannya dengan cara ini: ruang pengamatan dibagi menjadi sejumlah wilayah yang tidak tumpang tindih, dan kemudian frekuensi pengamatan dan probabilitas hipotetis dihitung untuk setiap wilayah.

Dalam hal ini, satu lagi ditambahkan ke kesulitan perkiraan yang disebutkan sebelumnya - pilihan partisi yang masuk akal dari ruang asli. Dalam hal ini, kehati-hatian harus diberikan untuk memastikan bahwa, secara umum, aturan untuk menguji hipotesis tentang distribusi awal sampel cukup sensitif terhadap kemungkinan alternatif. Terakhir, saya mencatat bahwa kriteria statistik yang didasarkan pada pengurangan skema Bernoulli, pada umumnya, tidak konsisten terhadap semua alternatif. Jadi metode pemeriksaan persetujuan ini mempunyai nilai yang terbatas.

Kriteria goodness-of-fit Kolmogorov-Smirnov dalam bentuk klasiknya lebih kuat daripada kriteria h2 dan dapat digunakan untuk menguji hipotesis tentang kesesuaian distribusi empiris dengan distribusi kontinu teoritis F(x) dengan parameter yang diketahui sebelumnya. Keadaan terakhir membatasi kemungkinan penerapan praktis yang luas dari kriteria ini ketika menganalisis hasil pengujian mekanis, karena parameter fungsi distribusi karakteristik sifat mekanik biasanya diperkirakan dari data sampel itu sendiri.

Kriteria Kolmogorov-Smirnov digunakan untuk data yang tidak dikelompokkan atau untuk data yang dikelompokkan dalam kasus lebar interval kecil (misalnya, sama dengan pembagian skala pengukur gaya, penghitung siklus beban, dll.). Misalkan hasil pengujian serangkaian n sampel merupakan rangkaian variasi karakteristik sifat mekanik

x1? x2? ...? xi? ...? xn. (3.93)

Diperlukan untuk menguji hipotesis nol bahwa distribusi sampling (3,93) termasuk dalam hukum teoritis F(x).

Kriteria Kolmogorov-Smirnov didasarkan pada distribusi deviasi maksimum akumulasi partikular dari nilai fungsi distribusi. Saat digunakan, statistik dihitung

yang merupakan statistik kriteria Kolmogorov. Jika ketimpangan masih terjadi

Entahlah? dahi (3,97)

untuk ukuran sampel besar (n > 35) atau

Dn(vn + 0,12 + 0,11/vn) ? dahi (3,98)

untuk n? 35, maka hipotesis nol tidak ditolak.

Jika pertidaksamaan (3,97) dan (3,98) tidak terpenuhi, hipotesis alternatif diterima bahwa sampel (3,93) termasuk dalam distribusi yang tidak diketahui.

Nilai kritis lb adalah: l0.1 = 1.22; l0,05 = 1,36; l0,01 = 1,63.

Jika parameter fungsi F(x) tidak diketahui sebelumnya, tetapi diperkirakan dari data sampel, kriteria Kolmogorov-Smirnov kehilangan universalitasnya dan hanya dapat digunakan untuk memeriksa kesesuaian data eksperimen dengan beberapa fungsi distribusi tertentu saja.

Ketika hipotesis nol digunakan bahwa data eksperimen termasuk dalam distribusi normal atau lognormal, statistik dihitung:

dimana Ц(zi) adalah nilai fungsi Laplace untuk

Ц(zi) = (xi - xср)/s Kriteria Kolmogorov-Smirnov untuk setiap ukuran sampel n ditulis dalam bentuk

Nilai kritis lb dalam hal ini adalah: l0.1 = 0.82; l0,05 = 0,89; l0,01 = 1,04.

Jika hipotesis diuji bahwa sampel sesuai dengan distribusi eksponensial ***, yang parameternya diperkirakan dari data eksperimen, statistik serupa dihitung:

kriteria probabilitas empiris

dan membentuk kriteria Kolmogorov-Smirnov.

Nilai kritis lb untuk kasus ini: l0.1 = 0.99; l0,05 = 1,09; l0,01 = 1,31.

Untuk menguji hipotesis tentang kesesuaian distribusi empiris dengan hukum distribusi teoritis, indikator statistik khusus digunakan - kriteria goodness-of-fit (atau kriteria kepatuhan). Ini termasuk kriteria Pearson, Kolmogorov, Romanovsky, Yastremsky, dll. Sebagian besar kriteria kesepakatan didasarkan pada penggunaan penyimpangan frekuensi empiris dari frekuensi teoretis. Jelasnya, semakin kecil penyimpangan ini, semakin baik distribusi teoretisnya sesuai dengan distribusi empiris (atau menggambarkannya).

Kriteria persetujuan- ini adalah kriteria untuk menguji hipotesis tentang kesesuaian distribusi empiris dengan distribusi probabilitas teoretis. Kriteria tersebut dibagi menjadi dua kelas: umum dan khusus. Uji goodness-of-fit umum diterapkan pada rumusan hipotesis yang paling umum, yaitu hipotesis yang hasil observasinya sesuai dengan distribusi probabilitas yang diasumsikan secara a priori. Uji kesesuaian khusus melibatkan hipotesis nol khusus yang menyatakan kesesuaian dengan bentuk distribusi probabilitas tertentu.

Kriteria kesepakatan, berdasarkan hukum distribusi yang ditetapkan, memungkinkan untuk menetapkan kapan perbedaan antara frekuensi teoretis dan empiris harus dianggap tidak signifikan (acak), dan kapan dianggap signifikan (non-acak). Oleh karena itu, kriteria kesepakatan memungkinkan untuk menolak atau mengkonfirmasi kebenaran hipotesis yang diajukan ketika menyelaraskan deret tentang sifat distribusi dalam deret empiris dan untuk menjawab apakah mungkin untuk menerima distribusi empiris tertentu. model yang diungkapkan oleh beberapa hukum distribusi teoritis.

Tes kesesuaian Pearson c 2 (chi-kuadrat) adalah salah satu kriteria utama kesepakatan. Diusulkan oleh ahli matematika Inggris Karl Pearson (1857-1936) untuk menilai keacakan (signifikansi) perbedaan antara frekuensi distribusi empiris dan teoritis:

Skema penerapan kriteria c 2 untuk menilai konsistensi distribusi teoritis dan empiris adalah sebagai berikut:

1. Ukuran perbedaan yang dihitung ditentukan.

2. Tentukan besarnya derajat kebebasan.

3. Berdasarkan banyaknya derajat kebebasan n ditentukan dengan menggunakan tabel khusus.

4. Jika , maka untuk tingkat signifikansi tertentu dan jumlah derajat kebebasan n, hipotesis tentang tidak signifikannya (keacakan) perbedaan tersebut ditolak. Jika tidak, hipotesis dapat dianggap tidak bertentangan dengan data eksperimen yang diperoleh dan dengan probabilitas (1 – α) dapat dikatakan bahwa perbedaan antara frekuensi teoritis dan empiris bersifat acak.

Tingkat signifikansi adalah kemungkinan menolak hipotesis yang diajukan secara keliru, yaitu. kemungkinan hipotesis yang benar akan ditolak. Dalam studi statistik, tergantung pada pentingnya dan tanggung jawab masalah yang dipecahkan, tiga tingkat signifikansi berikut digunakan:

1) a = 0,1, maka R = 0,9;

2) a = 0,05, maka R = 0,95;

3) a = 0,01, maka R = 0,99.

Dengan menggunakan kriteria kesepakatan c 2, syarat-syarat berikut harus dipenuhi:

1. Volume populasi yang diteliti harus cukup besar ( N≥ 50), sedangkan frekuensi atau ukuran grup minimal harus 5. Jika kondisi ini dilanggar, maka perlu menggabungkan frekuensi kecil terlebih dahulu (kurang dari 5).

2. Distribusi empiris harus terdiri dari data yang diperoleh dari hasil pengambilan sampel secara acak, yaitu. mereka harus mandiri.

Kerugian dari kriteria goodness-of-fit Pearson adalah hilangnya sebagian informasi asli terkait dengan kebutuhan untuk mengelompokkan hasil observasi ke dalam interval dan menggabungkan interval individu dengan sejumlah kecil observasi. Sehubungan dengan itu, disarankan untuk melengkapi pemeriksaan kesesuaian distribusi menurut kriteria dengan 2 kriteria lainnya. Hal ini terutama diperlukan dengan ukuran sampel yang relatif kecil ( N ≈ 100).

Dalam statistik Tes kesesuaian Kolmogorov(juga dikenal sebagai uji kesesuaian Kolmogorov-Smirnov) digunakan untuk menentukan apakah dua distribusi empiris mematuhi hukum yang sama, atau untuk menentukan apakah distribusi yang dihasilkan mematuhi model yang diasumsikan. Kriteria Kolmogorov didasarkan pada penentuan perbedaan maksimum antara frekuensi akumulasi atau frekuensi distribusi empiris atau teoritis. Kriteria Kolmogorov dihitung menggunakan rumus berikut:

Di mana D Dan D- karenanya, perbedaan maksimum antara frekuensi akumulasi ( FF¢) dan antara frekuensi akumulasi ( PP¢) rangkaian distribusi empiris dan teoritis; N- jumlah unit secara agregat.

Setelah menghitung nilai λ, digunakan tabel khusus untuk menentukan probabilitas yang dapat menyatakan bahwa penyimpangan frekuensi empiris dari frekuensi teoritis adalah acak. Jika tandanya bernilai hingga 0,3, maka ini berarti ada kebetulan frekuensi yang lengkap. Dengan jumlah observasi yang banyak, uji Kolmogorov mampu mendeteksi adanya penyimpangan terhadap hipotesis. Artinya, perbedaan distribusi sampel dengan distribusi teoritis akan dapat dideteksi dengan bantuannya jika jumlah observasi cukup banyak. Signifikansi praktis dari sifat ini tidak signifikan, karena dalam banyak kasus sulit untuk mengandalkan perolehan sejumlah besar pengamatan dalam kondisi konstan, gagasan teoretis tentang hukum distribusi yang harus dipatuhi sampel selalu bersifat perkiraan, dan keakuratan uji statistik tidak boleh melebihi keakuratan model yang dipilih.

Tes kesesuaian Romanovsky didasarkan pada penggunaan kriteria Pearson, yaitu. sudah ditemukan nilai c 2, dan banyaknya derajat kebebasan :

dimana n adalah jumlah derajat kebebasan variasi.

Kriteria Romanovsky cocok digunakan karena tidak adanya tabel untuk. Jika< 3, то расхождения распределений случайны, если же >3, maka distribusi tersebut tidak acak dan distribusi teoritis tidak dapat dijadikan model untuk distribusi empiris yang sedang dipelajari.

B. S. Yastremsky menggunakan kriteria kesepakatan bukan jumlah derajat kebebasan, tetapi jumlah kelompok ( k), nilai khusus q, bergantung pada jumlah kelompok, dan nilai chi-kuadrat. Tes kesesuaian Yastremski memiliki arti yang sama dengan kriteria Romanovsky dan dinyatakan dengan rumus

dimana c 2 adalah kriteria kesesuaian Pearson; - jumlah kelompok; q - koefisien, untuk jumlah kelompok kurang dari 20, sama dengan 0,6.

Jika L fakta > 3, perbedaan antara distribusi teoretis dan empiris tidak bersifat acak, yaitu distribusi empiris tidak memenuhi persyaratan distribusi normal. Jika L fakta< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.



Dukung proyek ini - bagikan tautannya, terima kasih!
Baca juga
Analog Postinor lebih murah Analog Postinor lebih murah Vertebra serviks kedua disebut Vertebra serviks kedua disebut Keputihan encer pada wanita: norma dan patologi Keputihan encer pada wanita: norma dan patologi