Antipiretik untuk anak-anak diresepkan oleh dokter anak. Namun ada situasi darurat demam dimana anak perlu segera diberikan obat. Kemudian orang tua mengambil tanggung jawab dan menggunakan obat antipiretik. Apa saja yang boleh diberikan kepada bayi? Bagaimana cara menurunkan suhu pada anak yang lebih besar? Obat apa yang paling aman?
Kriteria persetujuan (kepatuhan)
Untuk menguji hipotesis tentang kesesuaian distribusi empiris dengan hukum distribusi teoritis, indikator statistik khusus digunakan - kriteria goodness-of-fit (atau kriteria kepatuhan). Ini termasuk kriteria Pearson, Kolmogorov, Romanovsky, Yastremsky, dll. Sebagian besar kriteria kesepakatan didasarkan pada penggunaan penyimpangan frekuensi empiris dari frekuensi teoretis. Jelasnya, semakin kecil penyimpangan ini, semakin baik distribusi teoretisnya sesuai dengan distribusi empiris (atau menggambarkannya).
Kriteria persetujuan - ini adalah kriteria untuk menguji hipotesis tentang kesesuaian distribusi empiris dengan distribusi probabilitas teoretis. Kriteria tersebut dibagi menjadi dua kelas: umum dan khusus. Uji goodness-of-fit umum diterapkan pada rumusan hipotesis yang paling umum, yaitu hipotesis yang hasil observasinya sesuai dengan distribusi probabilitas yang diasumsikan secara a priori. Uji kesesuaian khusus melibatkan hipotesis nol khusus yang menyatakan kesesuaian dengan bentuk distribusi probabilitas tertentu.
Kriteria kesepakatan, berdasarkan hukum distribusi yang ditetapkan, memungkinkan untuk menetapkan kapan perbedaan antara frekuensi teoretis dan empiris harus dianggap tidak signifikan (acak), dan kapan dianggap signifikan (non-acak). Oleh karena itu, kriteria kesepakatan memungkinkan untuk menolak atau mengkonfirmasi kebenaran hipotesis yang diajukan ketika menyelaraskan deret tentang sifat distribusi dalam deret empiris dan untuk menjawab apakah mungkin untuk menerima distribusi empiris tertentu. model yang diungkapkan oleh beberapa hukum distribusi teoritis.
Uji kesesuaian χ 2 (chi-kuadrat) Pearson adalah salah satu uji kesesuaian yang utama. Diusulkan oleh ahli matematika Inggris Karl Pearson (1857-1936) untuk menilai keacakan (signifikansi) perbedaan antara frekuensi distribusi empiris dan teoritis:
Di mana k- jumlah kelompok yang distribusi empirisnya dibagi; fi- frekuensi empiris suatu sifat dalam Saya-kelompok ke-; / ts °р - frekuensi teoritis masuk saya-itu kelompok.
Skema penerapan kriteria kamu) untuk menilai konsistensi distribusi teoritis dan empiris adalah sebagai berikut.
- 1. Ukuran perbedaan yang dihitung % 2 asc ditentukan.
- 2. Tentukan besarnya derajat kebebasan.
- 3. Berdasarkan banyaknya derajat kebebasan v, %^bl ditentukan dengan menggunakan tabel khusus
- 4. Jika % 2 asch >x 2 abl, maka untuk tingkat signifikansi a tertentu dan jumlah derajat kebebasan v, hipotesis tentang tidak signifikannya (keacakan) perbedaan tersebut ditolak. Jika tidak, hipotesis dapat dianggap tidak bertentangan dengan data eksperimen yang diperoleh dan dengan probabilitas (1 - a) dapat dikatakan bahwa perbedaan antara frekuensi teoritis dan empiris bersifat acak.
Tingkat signifikansi - ini adalah kemungkinan menolak hipotesis yang diajukan secara keliru, yaitu. kemungkinan hipotesis yang benar akan ditolak. Dalam studi statistik, tergantung pada pentingnya dan tanggung jawab masalah yang dipecahkan, tiga tingkat signifikansi berikut digunakan:
- 1) a = 0,1, maka P = 0,9;
- 2) a = 0,05, maka P = 0,95;
- 3) a = 0,01, maka P = 0,99.
Menggunakan kriteria goodness-of-fit kamu), Kondisi berikut harus dipenuhi.
- 1. Volume penduduk yang diteliti harus memenuhi syarat hal> 50, sedangkan frekuensi atau ukuran grupnya minimal harus 5. Jika syarat ini dilanggar, maka perlu digabungkan terlebih dahulu frekuensi-frekuensi kecil (kurang dari 5).
- 2. Distribusi empiris harus terdiri dari data yang diperoleh dari hasil pengambilan sampel secara acak, yaitu. mereka harus mandiri.
Kerugian dari kriteria goodness-of-fit Pearson adalah hilangnya sebagian informasi asli terkait dengan kebutuhan untuk mengelompokkan hasil observasi ke dalam interval dan menggabungkan interval individu dengan sejumlah kecil observasi. Dalam hal ini, disarankan untuk melengkapi pemeriksaan kepatuhan distribusi dengan kriteria kamu) kriteria lainnya. Hal ini terutama diperlukan bila ukuran sampelnya besar P ~ 100.
Dalam statistik, uji kesesuaian Kolmogorov (juga dikenal sebagai uji kesesuaian Kolmogorov – Smirnov) digunakan untuk menentukan apakah dua distribusi empiris mematuhi hukum yang sama, atau untuk menentukan apakah distribusi yang dihasilkan mematuhi model yang diasumsikan. . Kriteria Kolmogorov didasarkan pada penentuan perbedaan maksimum antara frekuensi akumulasi atau frekuensi distribusi empiris atau teoritis. Kriteria Kolmogorov dihitung menggunakan rumus berikut:
Di mana D Dan D- karenanya, perbedaan maksimum antara frekuensi akumulasi (/-/") dan antara frekuensi akumulasi ( rr") rangkaian distribusi empiris dan teoritis; N- jumlah unit secara agregat.
Setelah menghitung nilainya X, tabel khusus digunakan untuk menentukan probabilitas yang dapat menyatakan bahwa penyimpangan frekuensi empiris dari frekuensi teoritis adalah acak. Jika tandanya bernilai hingga 0,3, maka ini berarti ada kebetulan frekuensi yang lengkap. Dengan jumlah observasi yang banyak, uji Kolmogorov mampu mendeteksi adanya penyimpangan terhadap hipotesis. Artinya, perbedaan distribusi sampel dengan distribusi teoritis akan dapat dideteksi dengan bantuannya jika jumlah observasi cukup banyak. Signifikansi praktis dari sifat ini tidak signifikan, karena dalam banyak kasus sulit untuk mengandalkan perolehan sejumlah besar pengamatan dalam kondisi konstan, gagasan teoretis tentang hukum distribusi yang harus dipatuhi sampel selalu merupakan perkiraan, dan keakuratan uji statistik tidak boleh melebihi keakuratan model yang dipilih.
Uji kesesuaian Romanovsky didasarkan pada penggunaan kriteria Pearson, yaitu. sudah ditemukan nilai x 2 > dan jumlah derajat kebebasan:
dimana v adalah jumlah derajat kebebasan variasi.
Kriteria Romanovsky cocok digunakan karena tidak adanya tabel untuk x2. Jika K r KE? > 3, maka distribusi tersebut non-acak dan distribusi teoritis tidak dapat dijadikan model untuk distribusi empiris yang sedang dipelajari.
B. S. Yastremsky menggunakan kriteria kesepakatan bukan jumlah derajat kebebasan, tetapi jumlah kelompok ( k), nilai khusus 0, bergantung pada jumlah kelompok, dan nilai chi-kuadrat. Kriteria kesepakatan Yastremsky memiliki arti yang sama dengan kriteria Romanovsky dan dinyatakan dengan rumus
dimana x 2 adalah uji kesesuaian Pearson; /e gr - jumlah grup; 0 - koefisien, untuk jumlah kelompok kurang dari 20 sama dengan 0,6.
Jika 1ph bertindak > 3, perbedaan antara distribusi teoretis dan empiris tidak bersifat acak, yaitu. distribusi empiris tidak memenuhi persyaratan distribusi normal. Jika 1f bertindak
Frekuensi teoritis dan empiris. Memeriksa distribusi normal
Saat menganalisis rangkaian distribusi variasi, caranya sangat penting distribusi empiris tanda sesuai normal. Untuk melakukan hal ini, frekuensi distribusi aktual harus dibandingkan dengan frekuensi teoritis yang merupakan ciri distribusi normal. Artinya, berdasarkan data aktual, perlu dihitung frekuensi teoritis kurva distribusi normal yang merupakan fungsi dari simpangan ternormalisasi.
Dengan kata lain, kurva distribusi empiris perlu disejajarkan dengan kurva distribusi normal.
Karakteristik objektif dari kepatuhan teoretis Dan empiris frekuensi dapat diperoleh dengan menggunakan indikator statistik khusus yang disebut kriteria persetujuan.
Kriteria kesepakatan disebut kriteria yang memungkinkan Anda menentukan apakah ada perbedaan empiris Dan teoretis distribusinya acak atau signifikan, yaitu apakah data observasi sesuai dengan hipotesis statistik yang diajukan atau tidak. Sebaran penduduk yang dimilikinya berdasarkan hipotesis yang diajukan disebut teoritis.
Ada kebutuhan untuk menginstal kriteria(aturan) yang memungkinkan seseorang menilai apakah perbedaan antara distribusi empiris dan teoritis bersifat acak atau signifikan. Jika ternyata ada perbedaan acak, maka mereka yakin bahwa data pengamatan (sampel) tersebut sesuai dengan hipotesis yang diajukan tentang hukum sebaran populasi umum dan oleh karena itu hipotesis diterima; jika ternyata ada perbedaan penting, maka data observasi tidak sesuai dengan hipotesis dan ditolak.
Biasanya, frekuensi empiris dan teoritis berbeda karena:
perbedaan tersebut bersifat acak dan disebabkan oleh terbatasnya jumlah pengamatan;
Perbedaan ini bukan suatu kebetulan dan dijelaskan oleh fakta bahwa hipotesis statistik bahwa populasi berdistribusi normal adalah keliru.
Dengan demikian, kriteria persetujuan memungkinkan untuk menolak atau membenarkan kebenaran hipotesis yang diajukan ketika menyelaraskan deret tentang sifat sebaran dalam deret empiris.
Frekuensi empiris diperoleh sebagai hasil observasi. Frekuensi teoritis dihitung menggunakan rumus.
Untuk hukum distribusi normal mereka dapat ditemukan sebagai berikut:
Σƒ saya- jumlah akumulasi frekuensi empiris (kumulatif).
h - perbedaan antara dua opsi yang bertetangga
σ - deviasi standar sampel
t – deviasi yang dinormalisasi (terstandarisasi).
φ(t)–fungsi kepadatan probabilitas berdistribusi normal (ditemukan dari tabel nilai fungsi Laplace lokal untuk nilai t yang sesuai)
Ada beberapa uji kesesuaian, yang paling umum adalah: uji chi-kuadrat (Pearson), uji Kolmogorov, dan uji Romanovsky.
Pearson χ uji kesesuaian 2 – salah satu yang utama, yang dapat direpresentasikan sebagai jumlah rasio kuadrat perbedaan antara frekuensi teoritis (f T) dan empiris (f) terhadap frekuensi teoritis:
k adalah jumlah kelompok yang distribusi empirisnya dibagi,
f i – frekuensi pengamatan sifat pada kelompok ke-i,
f T – frekuensi teoritis.
Untuk distribusi χ 2, telah disusun tabel yang menunjukkan nilai kritis kriteria goodness-of-fit χ 2 untuk tingkat signifikansi yang dipilih dan derajat kebebasan df (atau ν). Tingkat signifikansi α adalah kemungkinan salah menolak hipotesis yang diajukan, yaitu. kemungkinan hipotesis yang benar akan ditolak. R - signifikansi statistik menerima hipotesis yang benar. Dalam statistik, tiga tingkat signifikansi paling sering digunakan:
α=0,10, lalu P=0,90 (dalam 10 kasus dari 100)
α=0,05, lalu P=0,95 (dalam 5 kasus dari 100)
α=0,01, maka P=0,99 (dalam 1 kasus dari 100) hipotesis yang benar dapat ditolak
Jumlah derajat kebebasan df didefinisikan sebagai jumlah grup dalam deret distribusi dikurangi jumlah koneksi: df = k –z. Banyaknya koneksi dipahami sebagai banyaknya indikator deret empiris yang digunakan dalam menghitung frekuensi teoritis, yaitu. indikator yang menghubungkan frekuensi empiris dan teoritis. Misalnya, jika disejajarkan dengan kurva lonceng, terdapat tiga hubungan. Oleh karena itu, ketika diselaraskan oleh kurva lonceng jumlah derajat kebebasan didefinisikan sebagai df =k–3. Untuk menilai signifikansi, nilai yang dihitung dibandingkan dengan tabel χ 2
Jika distribusi teoritis dan empiris benar-benar bertepatan, χ 2 =0, jika tidak χ 2 >0. Jika χ 2 kal > χ 2 tab, maka untuk tingkat signifikansi dan jumlah derajat kebebasan tertentu, kami menolak hipotesis tentang tidak pentingnya (keacakan) perbedaan tersebut. Jika χ 2 dihitung< χ 2 табл то гипотезу принимаем и с вероятностью Р=(1-α) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно. Следовательно, есть основания утверждать, что эмпирическое распределение подчиняетсяdistribusi normal. Uji kesesuaian Pearson digunakan jika ukuran populasi cukup besar (N>50), dan frekuensi setiap kelompok minimal harus 5.
Tes kesesuaian Kolmogorov didasarkan pada penentuan perbedaan maksimum antara akumulasi frekuensi empiris dan teoritis:
dimana D dan d masing-masing adalah perbedaan maksimum antara frekuensi akumulasi dan frekuensi akumulasi distribusi empiris dan teoritis. Dengan menggunakan tabel distribusi statistik Kolmogorov, probabilitas ditentukan, yang dapat bervariasi dari 0 hingga 1. Ketika P(λ) = 1, terdapat frekuensi yang benar-benar kebetulan, P(λ) = 0 - perbedaan total. Jika nilai probabilitas P signifikan terhadap nilai yang ditemukan λ, maka kita dapat mengasumsikan bahwa perbedaan antara distribusi teoritis dan empiris tidak signifikan, yaitu acak. Syarat utama untuk menggunakan kriteria Kolmogorov adalah jumlah observasi yang cukup banyak.
Tes kesesuaian Kolmogorov
Mari kita perhatikan bagaimana kriteria Kolmogorov (λ) diterapkan ketika menguji hipotesis distribusi normal populasi umum. Menyelaraskan distribusi aktual dengan kurva lonceng terdiri dari beberapa langkah:
Bandingkan frekuensi aktual dan teoritis.
Berdasarkan data aktual, frekuensi teoritis dari kurva distribusi normal, yang merupakan fungsi dari deviasi ternormalisasi, ditentukan.
Mereka memeriksa sejauh mana distribusi karakteristik tersebut sesuai dengan normal.
Untuk kolom IV tabel:
Di MS Excel, deviasi ternormalisasi (t) dihitung menggunakan fungsi NORMALISASI. Penting untuk memilih rentang sel bebas berdasarkan jumlah opsi (baris spreadsheet). Tanpa menghapus pilihan, panggil fungsi NORMALIZE. Pada kotak dialog yang muncul, tunjukkan sel-sel berikut, yang masing-masing berisi nilai pengamatan (X i), rata-rata (X) dan simpangan baku Ϭ. Operasi harus diselesaikan serentak dengan menekan Ctrl+Shift+Enter
Untuk kolom V tabel:
Fungsi kepadatan probabilitas dari distribusi normal φ(t) ditemukan dari tabel nilai fungsi Laplace lokal untuk nilai yang sesuai dari deviasi ternormalisasi (t)
Untuk kolom VI tabel:
Tes kesesuaian Kolmogorov (λ) ditentukan dengan membagi modul perbedaan maksimal antara frekuensi kumulatif empiris dan teoritis dengan akar kuadrat dari jumlah observasi:
Dengan menggunakan tabel probabilitas khusus untuk kriteria kesepakatan λ, kami menentukan bahwa nilai λ = 0,59 sesuai dengan probabilitas 0,88 (λ
Distribusi frekuensi empiris dan teoritis, kepadatan probabilitas distribusi teoritis
Saat menerapkan uji kesesuaian untuk memeriksa apakah distribusi yang diamati (empiris) sesuai dengan distribusi teoritis, seseorang harus membedakan antara pengujian hipotesis sederhana dan kompleks.
Uji normalitas Kolmogorov-Smirnov satu sampel didasarkan pada perbedaan maksimum antara distribusi empiris kumulatif sampel dan distribusi kumulatif estimasi (teoretis). Jika statistik Kolmogorov-Smirnov D signifikan, maka hipotesis bahwa distribusi yang bersesuaian adalah normal harus ditolak.
Kriteria untuk memeriksa keacakan dan menilai observasi outlier Pengantar Sastra Dalam praktik analisis statistik data eksperimen, yang menjadi perhatian utama bukanlah perhitungan statistik tertentu itu sendiri, melainkan jawaban atas pertanyaan-pertanyaan jenis ini. Oleh karena itu, banyak kriteria telah dikembangkan untuk menguji hipotesis statistik yang diajukan. Semua kriteria untuk menguji hipotesis statistik dibagi menjadi dua kelompok besar: parametrik dan nonparametrik.
Bagikan pekerjaan Anda di jejaring sosial
Jika karya ini tidak cocok untuk Anda, di bagian bawah halaman terdapat daftar karya serupa. Anda juga dapat menggunakan tombol pencarian
Tes
Menggunakan Kriteria Persetujuan
Perkenalan
literatur
Perkenalan
Dalam praktek analisis statistik data eksperimen, yang menjadi perhatian utama bukanlah perhitungan statistik tertentu itu sendiri, melainkan jawaban atas pertanyaan-pertanyaan semacam itu. Apakah rata-rata populasi benar-benar sama dengan suatu angka tertentu? Apakah koefisien korelasi berbeda nyata dari nol? Apakah varians kedua sampel sama? Dan banyak pertanyaan serupa yang mungkin muncul, bergantung pada masalah penelitian spesifik. Oleh karena itu, banyak kriteria telah dikembangkan untuk menguji hipotesis statistik yang diajukan. Kami akan mempertimbangkan beberapa yang paling umum. Hal ini terutama berkaitan dengan mean, varians, koefisien korelasi dan distribusi kelimpahan.
Semua kriteria untuk menguji hipotesis statistik dibagi menjadi dua kelompok besar: parametrik dan nonparametrik. Uji parametrik didasarkan pada asumsi bahwa data sampel diambil dari populasi yang sebarannya diketahui, dan tugas utamanya adalah memperkirakan parameter sebaran tersebut. Pengujian nonparametrik tidak memerlukan asumsi apa pun tentang sifat distribusi, selain asumsi bahwa distribusi tersebut kontinu.
Mari kita lihat kriteria parametriknya terlebih dahulu. Urutan pengujian akan meliputi perumusan hipotesis nol dan hipotesis alternatif, perumusan asumsi yang akan dibuat, penentuan statistik sampel yang digunakan dalam pengujian dan, pembentukan distribusi sampel dari statistik yang diuji, penentuan daerah kritis untuk kriteria yang dipilih, dan konstruksi interval kepercayaan untuk statistik sampel.
1 Kriteria kelayakan sarana
Biarkan hipotesis yang diuji menjadi parameter populasi. Kebutuhan akan pemeriksaan tersebut mungkin timbul, misalnya, dalam situasi berikut. Misalkan, berdasarkan penelitian ekstensif, diameter cangkang fosil moluska dalam sedimen dari suatu lokasi tetap telah ditentukan. Mari kita juga memiliki sejumlah cangkang yang ditemukan di tempat lain, dan kita berasumsi bahwa tempat tertentu tidak mempengaruhi diameter cangkang, yaitu. bahwa nilai rata-rata diameter cangkang seluruh populasi moluska yang pernah hidup di tempat baru sama dengan nilai yang diketahui yang diperoleh sebelumnya ketika mempelajari jenis moluska tersebut di habitat pertamanya.
Jika nilai yang diketahui ini sama, maka hipotesis nol dan hipotesis alternatif ditulis sebagai berikut: Misalkan variabel x dalam populasi yang dipertimbangkan berdistribusi normal, dan nilai varians populasi tidak diketahui.
Kami akan menguji hipotesis menggunakan statistik:
, (1)
di mana adalah deviasi standar sampel.
Ditunjukkan bahwa jika benar, maka t pada persamaan (1) mempunyai distribusi t Student dengan derajat kebebasan n-1. Jika Anda memilih tingkat signifikansi (probabilitas menolak hipotesis yang benar) sama, maka sesuai dengan yang telah dibahas pada bab sebelumnya, Anda dapat menentukan nilai kritis untuk pengujian =0.
Dalam hal ini, karena distribusi Student simetris, maka (1-) bagian dari area di bawah kurva distribusi ini dengan n-1 derajat kebebasan akan terdapat di antara titik-titik dan, yang nilai absolutnya sama satu sama lain. . Oleh karena itu, semua nilai yang kurang dari nilai negatif dan lebih besar dari nilai positif untuk distribusi-t dengan sejumlah derajat kebebasan tertentu pada tingkat signifikansi yang dipilih akan merupakan wilayah kritis. Jika nilai t sampel berada dalam wilayah ini, maka hipotesis alternatif diterima.
Interval kepercayaan untuk dibuat menggunakan metode yang dijelaskan sebelumnya dan ditentukan dari ekspresi berikut
(2)
Jadi, dalam kasus kita, mari kita ketahui bahwa diameter cangkang fosil moluska adalah 18,2 mm. Kami memiliki sampel 50 cangkang yang baru ditemukan, dengan mm, a = 2,18 mm. Mari kita periksa: =18.2 melawan Kita punya
Jika tingkat signifikansi yang dipilih =0,05, maka nilai kritisnya. Oleh karena itu, hal tersebut dapat ditolak dan diterima pada tingkat signifikansi = 0,05. Jadi, untuk contoh hipotetis kita, dapat dikatakan (tentu saja dengan beberapa kemungkinan) bahwa diameter cangkang fosil moluska spesies tertentu bergantung pada tempat tinggalnya.
Karena distribusi t simetris, hanya nilai t positif dari distribusi ini yang diberikan pada tingkat signifikansi yang dipilih dan jumlah derajat kebebasan. Selain itu, tidak hanya bagian wilayah di bawah kurva distribusi di sebelah kanan nilai t yang diperhitungkan, tetapi juga di sebelah kiri nilai -t. Hal ini disebabkan oleh fakta bahwa dalam banyak kasus, ketika menguji hipotesis, kita tertarik pada signifikansi penyimpangan itu sendiri, terlepas dari apakah penyimpangan tersebut lebih besar atau lebih kecil, yaitu. kami memeriksa, bukan melawan: >a atau: Mari kita kembali ke contoh kita sekarang. Selang kepercayaan 100(1-)% adalah 18,92,01
Sekarang mari kita pertimbangkan kasus ketika kita perlu membandingkan rata-rata dua populasi umum. Hipotesis yang diuji seperti ini: : =0, : 0. Diasumsikan juga berdistribusi normal dengan mean dan varians, dan - berdistribusi normal dengan mean dan varians yang sama. Selain itu, kami berasumsi bahwa sampel yang digunakan untuk memperkirakan populasi umum diekstraksi secara independen satu sama lain dan memiliki volume masing-masing, dan Dari independensi sampel, maka jika kita mengambil jumlah yang lebih besar dan menghitung rata-ratanya. nilai untuk setiap pasangan, maka himpunan pasangan rata-rata tersebut akan sama sekali tidak berkorelasi. Pengujian hipotesis nol dilakukan dengan menggunakan statistik (3)
dimana dan adalah estimasi varians untuk sampel pertama dan kedua. Sangat mudah untuk melihat bahwa (3) merupakan generalisasi dari (1). Statistik (3) menunjukkan distribusi t Student dengan derajat kebebasan. Jika dan sama, mis. = = rumus (3) disederhanakan dan berbentuk (4)
Mari kita lihat sebuah contoh. Misalkan kita mengukur jumlah daun batang dari populasi tanaman yang sama selama dua musim, diperoleh hasil sebagai berikut: Kita asumsikan kondisi untuk menggunakan uji Student, yaitu: normalitas populasi dari mana sampel diambil, adanya varians yang tidak diketahui tetapi sama untuk populasi tersebut, dan independensi sampel terpenuhi. Mari kita perkirakan pada tingkat signifikansi =0,01. Kita punya Nilai tabel t = 2,58. Oleh karena itu, hipotesis tentang persamaan nilai rata-rata panjang batang daun suatu populasi tanaman selama dua musim harus ditolak pada tingkat signifikansi yang dipilih. Perhatian! Hipotesis nol dalam statistik matematika adalah hipotesis bahwa tidak ada perbedaan yang signifikan antara indikator-indikator yang dibandingkan, terlepas dari apakah kita berbicara tentang mean, varians, atau statistik lainnya. Dan dalam semua kasus ini, jika nilai empiris (dihitung dengan rumus) dari kriteria lebih besar dari nilai teoritis (dipilih dari tabel), maka ditolak. Jika nilai empirisnya lebih kecil dari nilai tabulasi, maka diterima. Untuk membangun selang kepercayaan untuk selisih rata-rata kedua populasi ini, mari kita perhatikan fakta bahwa uji Student, seperti dapat dilihat dari rumus (3), mengevaluasi signifikansi perbedaan antara rata-rata relatif. dengan kesalahan standar dari perbedaan ini. Sangat mudah untuk memverifikasi bahwa penyebut pada (3) mewakili kesalahan standar ini dengan menggunakan hubungan dan asumsi yang telah dibahas sebelumnya. Faktanya, kita mengetahuinya secara umum Jika x dan y independen, maka independen juga Mengambil nilai sampel dan bukannya x dan y, dan mengingat asumsi yang dibuat bahwa kedua populasi memiliki varian yang sama, kita peroleh (5)
Estimasi varians dapat diperoleh dari hubungan berikut (6)
(Kami membaginya karena dua kuantitas diperkirakan dari sampel dan, oleh karena itu, jumlah derajat kebebasan harus dikurangi dua.) Jika sekarang kita substitusikan (6) ke (5) dan ambil akar kuadratnya, kita mendapatkan penyebutnya dalam ekspresi (3). Setelah penyimpangan ini, mari kita kembali membangun interval kepercayaan untuk melalui -. Kita punya Mari kita berikan beberapa komentar terkait asumsi yang digunakan dalam membangun uji-t. Pertama-tama, terlihat bahwa pelanggaran asumsi normalitas berpengaruh tidak signifikan terhadap tingkat signifikansi dan kekuatan uji 30. Pelanggaran asumsi homogenitas varians kedua populasi yang dijadikan sampel adalah juga tidak signifikan, tetapi hanya jika ukuran sampelnya sama. Jika varians kedua populasi berbeda satu sama lain, maka probabilitas kesalahan tipe pertama dan kedua akan berbeda secara signifikan dari yang diharapkan. Dalam hal ini, kriteria harus digunakan untuk memeriksa (7)
dengan jumlah derajat kebebasan . (8)
Biasanya, ini adalah bilangan pecahan, oleh karena itu, ketika menggunakan tabel distribusi t, perlu untuk mengambil nilai tabel untuk nilai bilangan bulat terdekat dan melakukan interpolasi untuk menemukan t yang sesuai dengan memperoleh satu. Mari kita lihat sebuah contoh. Saat mempelajari dua subspesies katak danau, rasio panjang tubuh terhadap panjang tibia dihitung. Diambil dua sampel dengan volume =49 dan =27. Rata-rata dan varians dari hubungan yang kita minati ternyata sama, masing-masing =2,34; =2,08; =0,21; =0,35. Jika sekarang kita menguji hipotesis dengan menggunakan rumus (2), kita memperolehnya Pada tingkat signifikansi =0,05, kita harus menolak hipotesis nol (nilai tabel t = 1,995) dan berasumsi bahwa terdapat perbedaan yang signifikan secara statistik pada tingkat signifikansi yang dipilih antara nilai rata-rata parameter yang diukur untuk kedua subspesies katak. . Saat menggunakan rumus (6) dan (7) yang kita miliki Dalam hal ini, untuk tingkat signifikansi yang sama =0,05, nilai tabelnya adalah t=2,015, dan hipotesis nol diterima. Contoh ini dengan jelas menunjukkan bahwa mengabaikan kondisi yang diadopsi ketika menurunkan kriteria tertentu dapat menyebabkan hasil yang berlawanan dengan hasil yang sebenarnya terjadi. Tentu saja, dalam hal ini, dengan memiliki sampel dengan ukuran yang berbeda tanpa adanya fakta yang telah ditentukan sebelumnya bahwa varians dari indikator yang diukur pada kedua populasi adalah sama secara statistik, maka perlu menggunakan rumus (7) dan (8), yang mana menunjukkan tidak adanya perbedaan yang signifikan secara statistik. Oleh karena itu, saya ingin mengulangi sekali lagi bahwa memeriksa kepatuhan terhadap semua asumsi yang dibuat ketika menurunkan kriteria tertentu merupakan kondisi yang mutlak diperlukan untuk penggunaan yang benar. Persyaratan konstan dalam kedua modifikasi uji-t di atas adalah persyaratan bahwa sampel tidak bergantung satu sama lain. Namun, dalam praktiknya sering kali terdapat situasi di mana persyaratan ini tidak dapat dipenuhi karena alasan obyektif. Misalnya, beberapa indikator diukur pada hewan atau wilayah yang sama sebelum dan sesudah pengaruh faktor eksternal, dll. Dan dalam kasus ini kita mungkin tertarik untuk menguji hipotesis tersebut. Kami akan terus berasumsi bahwa kedua sampel diambil dari populasi normal dengan varian yang sama. Dalam hal ini kita dapat memanfaatkan fakta bahwa selisih antara besaran-besaran yang berdistribusi normal juga mempunyai distribusi normal, oleh karena itu kita dapat menggunakan uji t Student dalam bentuk (1). Dengan demikian, hipotesis akan diuji bahwa n perbedaan adalah sampel dari populasi yang berdistribusi normal dengan mean sama dengan nol. Menunjukkan perbedaan ke-i dengan, kita punya , (9) Mari kita lihat sebuah contoh. Mari kita miliki data tentang jumlah impuls sel saraf individu selama interval waktu tertentu sebelum () dan sesudah () aksi stimulus: Oleh karena itu, dengan mengingat bahwa (9) memiliki distribusi t, dan memilih tingkat signifikansi =0,01, dari tabel terkait di Lampiran kita menemukan bahwa nilai kritis t untuk n-1=10-1=9 derajat kebebasan adalah 3,25. Perbandingan nilai t-statistik teoritis dan empiris menunjukkan bahwa hipotesis nol tentang tidak adanya perbedaan yang signifikan secara statistik antara tingkat pemecatan sebelum dan sesudah stimulus harus ditolak. Dapat disimpulkan bahwa stimulus yang digunakan secara statistik mengubah frekuensi impuls secara signifikan. Dalam penelitian eksperimental, seperti disebutkan di atas, sampel dependen cukup sering muncul. Namun, fakta ini terkadang diabaikan dan uji-t digunakan secara salah pada bentuk (3). Ketidaktepatan hal ini dapat dilihat dengan mempertimbangkan kesalahan standar perbedaan antara rata-rata tidak berkorelasi dan berkorelasi. Dalam kasus pertama Dan yang kedua Kesalahan standar dari selisih d adalah Dengan mengingat hal ini, penyebut pada (9) akan berbentuk Sekarang mari kita perhatikan fakta bahwa pembilang ekspresi (4) dan (9) bertepatan: oleh karena itu, selisih nilai t di dalamnya bergantung pada penyebutnya. Jadi, jika rumus (3) digunakan pada permasalahan dengan sampel dependen, dan sampel tersebut mempunyai korelasi positif, maka nilai t yang dihasilkan akan lebih kecil dari yang seharusnya jika menggunakan rumus (9), dan dapat timbul situasi. dimana hipotesis nol akan diterima jika hipotesis tersebut salah. Situasi sebaliknya mungkin muncul bila terdapat korelasi negatif antar sampel, yaitu dalam hal ini perbedaan akan dianggap signifikan padahal sebenarnya tidak signifikan. Mari kita kembali ke contoh aktivitas impulsif dan menghitung nilai t untuk data yang diberikan menggunakan rumus (3), tanpa memperhatikan fakta bahwa sampel-sampel tersebut saling berhubungan. Kita mempunyai: Untuk jumlah derajat kebebasan sama dengan 18, dan tingkat signifikansi = 0,01, nilai tabelnya adalah t = 2,88 dan, sekilas, tampak tidak terjadi apa-apa, meskipun menggunakan rumus yang tidak sesuai untuk persamaan tersebut. kondisi tertentu. Dan dalam hal ini, nilai t yang dihitung mengarah pada penolakan hipotesis nol, yaitu. sampai pada kesimpulan yang sama yang dibuat dengan menggunakan rumus (9), benar dalam situasi ini. Namun mari kita format ulang data yang ada dan sajikan dalam bentuk berikut (2): Ini adalah nilai yang sama, dan dapat diperoleh dalam salah satu percobaan. Karena semua nilai pada kedua sampel dipertahankan, maka menggunakan uji t Student pada rumus (3) memberikan nilai yang diperoleh sebelumnya = 3,32 dan mengarah pada kesimpulan yang sama dengan yang telah dibuat. Sekarang mari kita hitung nilai t menggunakan rumus (9), yang harus digunakan dalam kasus ini. Kita mempunyai: Nilai kritis t pada tingkat signifikansi yang dipilih dan sembilan derajat kebebasan adalah 3,25. Oleh karena itu, kami tidak mempunyai alasan untuk menolak hipotesis nol, kami menerimanya, dan ternyata kesimpulan tersebut berbanding terbalik dengan kesimpulan yang diambil dengan menggunakan rumus (3). Dengan menggunakan contoh ini, kami sekali lagi diyakinkan betapa pentingnya mematuhi semua persyaratan yang menjadi dasar penentuan kriteria tertentu untuk memperoleh kesimpulan yang benar ketika menganalisis data eksperimen. Modifikasi uji Siswa yang dipertimbangkan dimaksudkan untuk menguji hipotesis mengenai rata-rata dua sampel. Namun, situasi muncul ketika kesimpulan perlu ditarik mengenai kesetaraan k rata-rata pada saat yang bersamaan. Untuk hal ini juga telah dikembangkan prosedur statistik tertentu, yang akan dibahas kemudian ketika membahas masalah-masalah yang berkaitan dengan analisis varians. 2 Uji kesesuaian untuk variansi Pengujian hipotesis statistik mengenai varians populasi dilakukan dalam urutan yang sama seperti rata-rata. Mari kita ingat secara singkat urutan ini. 1. Hipotesis nol dirumuskan (tentang tidak adanya perbedaan signifikan secara statistik antara varians yang dibandingkan). 2. Beberapa asumsi dibuat mengenai distribusi sampling statistik yang direncanakan untuk memperkirakan parameter yang termasuk dalam hipotesis. 3. Tingkat signifikansi untuk menguji hipotesis dipilih. 4. Nilai statistik yang menarik bagi kami dihitung dan keputusan dibuat mengenai kebenaran hipotesis nol. Sekarang mari kita mulai dengan menguji hipotesis bahwa varians populasi =a, yaitu. melawan. Jika kita berasumsi bahwa variabel x berdistribusi normal dan sampel berukuran n diambil secara acak dari populasi, maka statistik digunakan untuk menguji hipotesis nol. (10)
Mengingat rumus menghitung dispersi, kita menulis ulang (10) sebagai berikut: . (11)
Dari ungkapan ini jelas bahwa pembilangnya adalah jumlah kuadrat simpangan nilai-nilai yang berdistribusi normal dari rata-ratanya. Masing-masing penyimpangan tersebut juga berdistribusi normal. Oleh karena itu, sesuai dengan distribusi yang kita ketahui, jumlah kuadrat nilai statistik yang terdistribusi normal (10) dan (11) mempunyai distribusi - dengan derajat kebebasan n-1. Dengan analogi penggunaan distribusi-t, ketika memeriksa tingkat signifikansi yang dipilih, titik kritis ditetapkan dari tabel distribusi, sesuai dengan probabilitas menerima hipotesis nol dan. Interval kepercayaan untuk pada yang dipilih dibuat sebagai berikut: . (12)
Mari kita lihat sebuah contoh. Mari kita asumsikan, berdasarkan penelitian eksperimental yang ekstensif, bahwa penyebaran kandungan alkaloid suatu spesies tumbuhan dari suatu daerah tertentu sama dengan 4,37 satuan konvensional. Spesialis tersebut mempunyai sampel n = 28 tanaman tersebut, mungkin dari area yang sama. Analisis menunjukkan bahwa untuk sampel ini =5,01 dan perlu dipastikan bahwa varians ini dan varians yang diketahui sebelumnya tidak dapat dibedakan secara statistik pada tingkat signifikansi =0,1. Menurut rumus (10) yang kita miliki Nilai yang dihasilkan harus dibandingkan dengan nilai kritis /2=0,05 dan 1--/2=0,95. Dari tabel Lampiran untuk dengan 27 derajat kebebasan diperoleh masing-masing 40,1 dan 16,2 yang berarti hipotesis nol dapat diterima. Interval kepercayaan yang sesuai untuk adalah 3,37<<8,35.
Berbeda dengan pengujian hipotesis mengenai mean sampel dengan menggunakan uji Student, ketika kesalahan tipe pertama dan kedua tidak berubah secara signifikan ketika asumsi distribusi normal populasi dilanggar, dalam kasus hipotesis tentang varians ketika kondisi normalitas tidak terpenuhi. terpenuhi, kesalahan berubah secara signifikan. Masalah yang dibahas di atas mengenai persamaan varians terhadap suatu nilai tetap mempunyai kepentingan yang terbatas, karena situasi yang sangat jarang terjadi ketika varians suatu populasi diketahui. Yang lebih menarik adalah kasus ketika Anda perlu memeriksa apakah varians dari dua populasi adalah sama, yaitu. menguji hipotesis terhadap alternatif. Diasumsikan bahwa sampel berukuran dan diambil secara acak dari populasi umum dengan varian dan. Untuk menguji hipotesis nol digunakan uji rasio varians Fisher (13)
Karena jumlah simpangan kuadrat variabel acak yang berdistribusi normal dari meannya mempunyai distribusi, maka pembilang dan penyebut (13) adalah nilai terdistribusi dibagi dengan dan masing-masing, dan oleh karena itu rasionya mempunyai distribusi F dengan -1 dan -1 derajat kebebasan. Secara umum diterima - dan begitulah cara tabel distribusi F dibuat - bahwa varian terbesar diambil sebagai pembilang pada (13), dan oleh karena itu hanya satu titik kritis yang ditentukan, sesuai dengan tingkat signifikansi yang dipilih. Mari kita miliki dua sampel dengan volume =11 dan =28 dari populasi keong tambak biasa dan keong lonjong, yang rasio tinggi terhadap lebarnya mempunyai varian =0,59 dan =0,38. Hipotesis tentang persamaan varians indikator-indikator tersebut perlu diuji untuk populasi yang diteliti pada tingkat signifikansi =0,05. Kita punya Dalam literatur, terkadang Anda dapat menemukan pernyataan bahwa pengujian hipotesis tentang persamaan mean dengan menggunakan uji Student harus didahului dengan pengujian hipotesis tentang persamaan varians. Ini adalah rekomendasi yang salah. Selain itu, hal ini dapat menimbulkan kesalahan yang dapat dihindari jika tidak diikuti. Memang hasil pengujian hipotesis persamaan varians dengan menggunakan uji Fisher sangat bergantung pada asumsi bahwa sampel diambil dari populasi yang berdistribusi normal. Pada saat yang sama, uji Student tidak sensitif terhadap pelanggaran normalitas, dan jika sampel dengan ukuran yang sama dapat diperoleh, maka asumsi persamaan varians juga tidak signifikan. Dalam kasus n yang tidak sama, rumus (7) dan (8) harus digunakan untuk verifikasi. Saat menguji hipotesis tentang persamaan varians, beberapa fitur muncul dalam perhitungan yang terkait dengan sampel dependen. Dalam hal ini, statistik digunakan untuk menguji suatu hipotesis terhadap suatu alternatif (14)
Jika hipotesis nol benar, maka statistik (14) memiliki distribusi t Student dengan derajat kebebasan n-2. Saat mengukur kilap 35 sampel pelapis, diperoleh dispersi =134,5. Pengukuran berulang dua minggu kemudian menunjukkan =199,1. Dalam hal ini, koefisien korelasi antara pengukuran berpasangan ternyata sama dengan =0,876. Jika kita mengabaikan fakta bahwa sampel bergantung dan menggunakan uji Fisher untuk menguji hipotesis, kita mendapatkan F=1,48. Jika memilih tingkat signifikansi =0,05, maka hipotesis nol diterima, karena nilai kritis distribusi F untuk =35-1=34 dan =35-1=34 derajat kebebasan adalah 1,79. Pada saat yang sama, jika kita menggunakan rumus (14) yang sesuai untuk kasus ini, kita memperoleh t = 2,35, sedangkan nilai kritis t untuk 33 derajat kebebasan dan tingkat signifikansi yang dipilih = 0,05 sama dengan 2,03. Oleh karena itu, hipotesis nol tentang varians yang sama pada kedua sampel harus ditolak. Jadi, dari contoh ini jelas bahwa, seperti dalam kasus pengujian hipotesis kesetaraan sarana, penggunaan kriteria yang tidak mempertimbangkan kekhususan data eksperimen menyebabkan kesalahan. Dalam literatur yang direkomendasikan, Anda dapat menemukan uji Bartlett, yang digunakan untuk menguji hipotesis tentang persamaan k varians secara simultan. Selain fakta bahwa menghitung statistik kriteria ini cukup melelahkan, kelemahan utama kriteria ini adalah sangat sensitif terhadap penyimpangan dari asumsi distribusi normal populasi dari mana sampel diambil. Jadi, ketika menggunakannya, Anda tidak akan pernah bisa yakin bahwa hipotesis nol benar-benar ditolak karena variansnya berbeda secara signifikan secara statistik, dan bukan karena sampelnya tidak terdistribusi normal. Oleh karena itu, jika timbul permasalahan dalam membandingkan beberapa varians, maka perlu dicari rumusan masalah yang memungkinkan untuk menggunakan kriteria Fisher atau modifikasinya. 3 Kriteria kesepakatan mengenai saham Seringkali kita perlu menganalisis populasi di mana objek dapat diklasifikasikan ke dalam salah satu dari dua kategori. Misalnya berdasarkan jenis kelamin pada suatu populasi tertentu, berdasarkan adanya unsur jejak tertentu di dalam tanah, berdasarkan warna gelap atau terang telur pada beberapa spesies burung, dan sebagainya. Proporsi elemen yang mempunyai kualitas tertentu dilambangkan dengan P, dimana P mewakili rasio objek dengan kualitas yang kita minati terhadap semua objek secara agregat.
Di mana