Varians totalnya sama. Indikator variasi: konsep, jenis, rumus perhitungan

.

Sebaliknya, if adalah ae non-negatif. berfungsi sedemikian rupa , maka ada ukuran probabilitas yang benar-benar kontinu sehingga menjadi kepadatannya.

    Mengganti ukuran dalam integral Lebesgue:

,

dimana adalah fungsi Borel yang dapat diintegralkan terhadap ukuran probabilitas.

Dispersi, Jenis dan Sifat Dispersi Konsep dispersi

Dispersi dalam statistik ditemukan sebagai deviasi standar dari nilai individu dari karakteristik yang dikuadratkan dari mean aritmatika. Bergantung pada data awal, ditentukan dengan menggunakan rumus varians sederhana dan tertimbang:

1. Varians sederhana(untuk data yang tidak dikelompokkan) dihitung menggunakan rumus:

2. Varians tertimbang (untuk rangkaian variasi):

dimana n adalah frekuensi (pengulangan faktor X)

Contoh mencari varians

Halaman ini menjelaskan contoh standar untuk menemukan varians, Anda juga dapat melihat masalah lain untuk menemukannya

Contoh 1. Penentuan kelompok, rata-rata kelompok, antarkelompok dan varians total

Contoh 2. Mencari varians dan koefisien variasi dalam tabel pengelompokan

Contoh 3. Mencari varians pada deret diskrit

Contoh 4. Data berikut tersedia untuk sekelompok 20 siswa korespondensi. Perlu dibuat deret interval sebaran suatu sifat, menghitung nilai rata-rata suatu sifat dan mempelajari penyebarannya

Mari kita buat pengelompokan interval. Mari kita tentukan rentang intervalnya menggunakan rumus:

dimana X max adalah nilai maksimum dari karakteristik pengelompokan; X min – nilai minimum dari karakteristik pengelompokan; n – jumlah interval:

Kami menerima n=5. Langkahnya adalah: h = (192 - 159)/ 5 = 6,6

Mari buat pengelompokan interval

Untuk perhitungan lebih lanjut, kami akan membuat tabel tambahan:

X"i – titik tengah interval. (misalnya, titik tengah interval 159 – 165.6 = 162.3)

Kita menentukan rata-rata tinggi badan siswa menggunakan rumus rata-rata aritmatika tertimbang:

Mari kita tentukan variansnya menggunakan rumus:

Rumusnya dapat diubah seperti ini:

Dari rumus ini berikut ini varians sama dengan perbedaan antara rata-rata kuadrat pilihan dan kuadrat dan rata-rata.

Dispersi dalam deret variasi dengan interval yang sama menggunakan metode momen dapat dihitung dengan cara berikut menggunakan sifat dispersi kedua (membagi semua opsi dengan nilai interval). Menentukan varians, dihitung menggunakan metode momen, menggunakan rumus berikut ini tidak terlalu memakan waktu:

dimana i adalah nilai interval; A adalah nol konvensional, yang mana akan lebih mudah untuk menggunakan titik tengah interval dengan frekuensi tertinggi; m1 adalah kuadrat momen orde pertama; m2 - momen orde kedua

Varians sifat alternatif (jika dalam suatu populasi statistik suatu karakteristik berubah sedemikian rupa sehingga hanya terdapat dua pilihan yang saling eksklusif, maka variabilitas tersebut disebut alternatif) dapat dihitung dengan menggunakan rumus:

Mengganti q = 1- p ke dalam rumus dispersi ini, kita mendapatkan:

Jenis varians

Varians total mengukur variasi suatu karakteristik pada seluruh populasi secara keseluruhan di bawah pengaruh semua faktor yang menyebabkan variasi tersebut. Ini sama dengan kuadrat rata-rata dari deviasi nilai individu suatu karakteristik x dari nilai rata-rata keseluruhan x dan dapat didefinisikan sebagai varians sederhana atau varians tertimbang.

Varians dalam kelompok mencirikan variasi acak, yaitu bagian dari variasi yang disebabkan oleh pengaruh faktor-faktor yang tidak terhitung dan tidak bergantung pada atribut-faktor yang menjadi dasar kelompoknya. Dispersi tersebut sama dengan kuadrat rata-rata deviasi nilai individu atribut dalam grup X dari mean aritmatika grup dan dapat dihitung sebagai dispersi sederhana atau sebagai dispersi tertimbang.

Dengan demikian, ukuran varians dalam kelompok variasi suatu sifat dalam suatu kelompok dan ditentukan dengan rumus:

dimana xi adalah rata-rata kelompok; ni adalah jumlah unit dalam grup.

Misalnya, varians intragrup yang perlu ditentukan dalam tugas mempelajari pengaruh kualifikasi pekerja terhadap tingkat produktivitas tenaga kerja di suatu bengkel menunjukkan variasi output pada setiap kelompok yang disebabkan oleh semua faktor yang mungkin (kondisi teknis peralatan, ketersediaan peralatan). alat dan bahan, umur pekerja, intensitas tenaga kerja, dan lain-lain.), kecuali perbedaan kategori kualifikasi (dalam suatu kelompok semua pekerja mempunyai kualifikasi yang sama).

Rata-rata varians dalam kelompok mencerminkan variasi acak, yaitu bagian variasi yang terjadi karena pengaruh semua faktor lain, kecuali faktor pengelompokan. Itu dihitung menggunakan rumus:

Varians antarkelompok mencirikan variasi sistematis dari sifat yang dihasilkan, yang disebabkan oleh pengaruh faktor-atribut yang menjadi dasar kelompok. Nilai ini sama dengan kuadrat rata-rata deviasi rata-rata kelompok dari rata-rata keseluruhan. Varians antarkelompok dihitung dengan menggunakan rumus:

Varians suatu variabel acak merupakan ukuran penyebaran nilai-nilai variabel tersebut. Varians yang rendah berarti nilai-nilai tersebut mengelompok berdekatan. Sebaran yang besar menunjukkan penyebaran nilai yang kuat. Konsep varians variabel acak digunakan dalam statistik. Misalnya, jika Anda membandingkan varian dua nilai (misalnya antara pasien pria dan wanita), Anda dapat menguji signifikansi suatu variabel. Varians juga digunakan saat membuat model statistik, karena varians yang rendah dapat menjadi tanda bahwa Anda melakukan penyesuaian nilai secara berlebihan.

Langkah

Menghitung varians sampel

  1. Catat nilai sampel. Dalam kebanyakan kasus, ahli statistik hanya memiliki akses terhadap sampel populasi tertentu. Misalnya, sebagai aturan, ahli statistik tidak menganalisis biaya pemeliharaan total semua mobil di Rusia - mereka menganalisis sampel acak beberapa ribu mobil. Sampel seperti itu akan membantu menentukan harga rata-rata sebuah mobil, tetapi kemungkinan besar, nilai yang dihasilkan akan jauh dari nilai sebenarnya.

    • Misalnya, mari kita analisis jumlah roti yang terjual di kafe selama 6 hari, yang diambil urutan acak. Sampelnya seperti ini: 17, 15, 23, 7, 9, 13. Ini adalah sampel, bukan populasi, karena kami tidak memiliki data roti yang terjual setiap hari kafe buka.
    • Jika Anda diberikan nilai populasi dan bukan sampel, lanjutkan ke bagian berikutnya.
  2. Tuliskan rumus untuk menghitung varians sampel. Dispersi adalah ukuran penyebaran nilai-nilai dalam besaran tertentu. Semakin dekat nilai variansnya dengan nol, maka semakin dekat pula nilai-nilai tersebut dikelompokkan. Saat mengerjakan sampel nilai, gunakan rumus berikut untuk menghitung varians:

    • s 2 (\gaya tampilan s^(2)) = ∑[(x saya (\gaya tampilan x_(i))- X) 2 (\gaya tampilan ^(2))] / (n - 1)
    • s 2 (\gaya tampilan s^(2))– ini adalah dispersi. Dispersi diukur dalam satuan persegi.
    • x saya (\gaya tampilan x_(i))– setiap nilai dalam sampel.
    • x saya (\gaya tampilan x_(i)) Anda perlu mengurangi x̅, mengkuadratkannya, lalu menjumlahkan hasilnya.
    • x̅ – mean sampel (rata-rata sampel).
    • n – jumlah nilai dalam sampel.
  3. Hitung mean sampel. Dilambangkan dengan x̅. Rata-rata sampel dihitung sebagai rata-rata aritmatika sederhana: jumlahkan semua nilai dalam sampel, lalu bagi hasilnya dengan jumlah nilai dalam sampel.

    • Dalam contoh kita, tambahkan nilai dalam sampel: 15+17+23+7+9+13=84
      Sekarang bagi hasilnya dengan banyaknya nilai dalam sampel (dalam contoh kita ada 6): 84 6 = 14.
      Rata-rata sampel x̅ = 14.
    • Rata-rata sampel adalah nilai sentral di mana nilai-nilai dalam sampel didistribusikan. Jika nilai-nilai dalam cluster sampel berada di sekitar mean sampel, maka variansnya kecil; jika tidak, variansnya besar.
  4. Kurangi mean sampel dari setiap nilai dalam sampel. Sekarang hitung selisihnya x saya (\gaya tampilan x_(i))- x̅, dimana x saya (\gaya tampilan x_(i))– setiap nilai dalam sampel. Setiap hasil yang diperoleh menunjukkan derajat penyimpangan suatu nilai tertentu dari mean sampel, yaitu seberapa jauh nilai tersebut dari mean sampel.

    • Dalam contoh kita:
      x 1 (\gaya tampilan x_(1))- x̅ = 17 - 14 = 3
      x 2 (\gaya tampilan x_(2))- x̅ = 15 - 14 = 1
      x 3 (\gaya tampilan x_(3))- x = 23 - 14 = 9
      x 4 (\gaya tampilan x_(4))- x̅ = 7 - 14 = -7
      x 5 (\gaya tampilan x_(5))- x̅ = 9 - 14 = -5
      x 6 (\gaya tampilan x_(6))- x̅ = 13 - 14 = -1
    • Kebenaran hasil yang diperoleh mudah untuk diperiksa, karena jumlahnya harus sama dengan nol. Hal ini berkaitan dengan penentuan nilai rata-rata, karena nilai-nilai negatif(jarak dari nilai rata-rata ke nilai yang lebih kecil) sepenuhnya dikompensasi oleh nilai positif (jarak dari nilai rata-rata ke nilai yang besar).
  5. Seperti disebutkan di atas, jumlah perbedaannya x saya (\gaya tampilan x_(i))- x̅ harus sama dengan nol. Artinya varians rata-rata selalu nol, sehingga tidak memberikan gambaran apapun tentang penyebaran nilai suatu besaran tertentu. Untuk mengatasi masalah ini, kuadratkan setiap perbedaannya x saya (\gaya tampilan x_(i))- X. Ini akan mengakibatkan Anda hanya mendapatkan angka positif, yang bila ditambahkan tidak akan pernah menghasilkan 0.

    • Dalam contoh kita:
      (x 1 (\gaya tampilan x_(1))- X) 2 = 3 2 = 9 (\gaya tampilan ^(2)=3^(2)=9)
      (x 2 (\gaya tampilan (x_(2))- X) 2 = 1 2 = 1 (\gaya tampilan ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Anda menemukan kuadrat selisihnya - x̅) 2 (\gaya tampilan ^(2)) untuk setiap nilai dalam sampel.
  6. Hitung jumlah kuadrat selisihnya. Artinya, carilah bagian rumus yang ditulis seperti ini: ∑[( x saya (\gaya tampilan x_(i))- X) 2 (\gaya tampilan ^(2))]. Di sini tanda Σ berarti jumlah selisih kuadrat untuk setiap nilai x saya (\gaya tampilan x_(i)) dalam sampel. Anda telah menemukan perbedaan kuadratnya (xi (\gaya tampilan (x_(i))- X) 2 (\gaya tampilan ^(2)) untuk setiap nilai x saya (\gaya tampilan x_(i)) dalam sampel; sekarang tambahkan saja kotak-kotak ini.

    • Dalam contoh kita: 9+1+81+49+25+1= 166 .
  7. Bagilah hasilnya dengan n - 1, di mana n adalah banyaknya nilai dalam sampel. Beberapa waktu lalu, untuk menghitung varians sampel, ahli statistik cukup membagi hasilnya dengan n; dalam hal ini Anda akan mendapatkan rata-rata varians kuadrat, yang ideal untuk mendeskripsikan varians sampel tertentu. Namun perlu diingat bahwa sampel apa pun hanyalah sebagian kecil dari nilai populasi. Jika Anda mengambil sampel lain dan melakukan perhitungan yang sama, Anda akan mendapatkan hasil yang berbeda. Ternyata, membaginya dengan n - 1 (bukan hanya n) akan memberikan perkiraan varians populasi yang lebih akurat, dan itulah yang Anda minati. Pembagian dengan n – 1 sudah menjadi hal yang umum, sehingga dimasukkan dalam rumus menghitung varians sampel.

    • Dalam contoh kita, sampel mencakup 6 nilai, yaitu n = 6.
      Varians sampel = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Perbedaan antara varians dan deviasi standar. Perhatikan bahwa rumusnya mengandung eksponen, sehingga dispersi diukur dalam satuan kuadrat dari nilai yang dianalisis. Terkadang besarnya seperti itu cukup sulit untuk dioperasikan; dalam kasus seperti ini, gunakan deviasi standar, yang sama dengan akar kuadrat dari varians. Itulah sebabnya varians sampel dilambangkan sebagai s 2 (\gaya tampilan s^(2)), A deviasi standar sampel - bagaimana s (\gaya tampilan s).

    • Dalam contoh kita, simpangan baku sampel adalah: s = √33.2 = 5.76.

    Menghitung Varians Populasi

    1. Analisis serangkaian nilai. Himpunan mencakup semua nilai besaran yang dipertimbangkan. Misalnya, jika Anda mempelajari usia penduduk wilayah Leningrad, maka totalitasnya mencakup usia seluruh penduduk wilayah tersebut. Saat bekerja dengan suatu populasi, disarankan untuk membuat tabel dan memasukkan nilai populasi ke dalamnya. Perhatikan contoh berikut:

      • Dalam suatu ruangan terdapat 6 akuarium. Setiap akuarium berisi jumlah ikan berikut:
        x 1 = 5 (\gaya tampilan x_(1)=5)
        x 2 = 5 (\gaya tampilan x_(2)=5)
        x 3 = 8 (\gaya tampilan x_(3)=8)
        x 4 = 12 (\gaya tampilan x_(4)=12)
        x 5 = 15 (\gaya tampilan x_(5)=15)
        x 6 = 18 (\gaya tampilan x_(6)=18)
    2. Tuliskan rumus untuk menghitung varians populasi. Karena totalitas mencakup semua nilai besaran tertentu, rumus di bawah ini memungkinkan kita memperolehnya nilai yang tepat varians populasi. Untuk membedakan varians populasi dari varians sampel (yang hanya merupakan perkiraan), ahli statistik menggunakan berbagai variabel:

      • σ 2 (\gaya tampilan ^(2)) = (∑(x saya (\gaya tampilan x_(i)) - μ) 2 (\gaya tampilan ^(2)))/N
      • σ 2 (\gaya tampilan ^(2))– penyebaran penduduk (dibaca “sigma kuadrat”). Dispersi diukur dalam satuan persegi.
      • x saya (\gaya tampilan x_(i))– setiap nilai secara keseluruhan.
      • Σ – tanda penjumlahan. Artinya, dari setiap nilai x saya (\gaya tampilan x_(i)) Anda perlu mengurangi μ, mengkuadratkannya, lalu menjumlahkan hasilnya.
      • μ – rata-rata populasi.
      • n – jumlah nilai dalam populasi.
    3. Hitung rata-rata populasi. Saat menangani suatu populasi, meannya dilambangkan sebagai μ (mu). Rata-rata populasi dihitung sebagai rata-rata aritmatika sederhana: jumlahkan semua nilai dalam populasi, lalu bagi hasilnya dengan banyaknya nilai dalam populasi.

      • Ingatlah bahwa rata-rata tidak selalu dihitung sebagai rata-rata aritmatika.
      • Dalam contoh kita, rata-rata populasi: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Kurangi mean populasi dari setiap nilai dalam populasi. Semakin dekat nilai selisihnya ke nol, maka semakin dekat nilai spesifiknya dengan rata-rata populasi. Temukan perbedaan antara setiap nilai dalam populasi dan rata-ratanya, dan Anda akan mendapatkan gambaran awal tentang distribusi nilai.

      • Dalam contoh kita:
        x 1 (\gaya tampilan x_(1))- = 5 - 10,5 = -5,5
        x 2 (\gaya tampilan x_(2))- = 5 - 10,5 = -5,5
        x 3 (\gaya tampilan x_(3))- = 8 - 10,5 = -2,5
        x 4 (\gaya tampilan x_(4))- = 12 - 10,5 = 1,5
        x 5 (\gaya tampilan x_(5))- = 15 - 10,5 = 4,5
        x 6 (\gaya tampilan x_(6))- = 18 - 10,5 = 7,5
    5. Kuadratkan setiap hasil yang diperoleh. Nilai selisihnya akan positif dan negatif; Jika nilai-nilai tersebut diplot pada garis bilangan, maka nilai-nilai tersebut akan terletak di kanan dan kiri mean populasi. Ini tidak cocok untuk menghitung varians, karena positif dan angka negatif saling memberikan kompensasi. Jadi kuadratkan setiap selisih untuk mendapatkan bilangan positif saja.

      • Dalam contoh kita:
        (x saya (\gaya tampilan x_(i)) - μ) 2 (\gaya tampilan ^(2)) untuk setiap nilai populasi (dari i = 1 sampai i = 6):
        (-5,5)2 (\gaya tampilan ^(2)) = 30,25
        (-5,5)2 (\gaya tampilan ^(2)), Di mana x n (\gaya tampilan x_(n))– nilai terakhir dalam populasi.
      • Untuk menghitung nilai rata-rata dari hasil yang diperoleh, Anda perlu mencari jumlahnya dan membaginya dengan n:(( x 1 (\gaya tampilan x_(1)) - μ) 2 (\gaya tampilan ^(2)) + (x 2 (\gaya tampilan x_(2)) - μ) 2 (\gaya tampilan ^(2)) + ... + (x n (\gaya tampilan x_(n)) - μ) 2 (\gaya tampilan ^(2)))/N
      • Sekarang mari kita tuliskan penjelasan di atas dengan menggunakan variabel: (∑( x saya (\gaya tampilan x_(i)) - μ) 2 (\gaya tampilan ^(2))) / n dan dapatkan rumus untuk menghitung varians populasi.

Pada bagian sebelumnya, kami telah menyajikan sejumlah rumus yang memungkinkan kita menemukan karakteristik numerik suatu fungsi ketika hukum distribusi argumen diketahui. Namun, dalam banyak kasus, untuk menemukan karakteristik numerik suatu fungsi, bahkan tidak perlu mengetahui hukum distribusi argumen, tetapi cukup mengetahui beberapa karakteristik numeriknya saja; pada saat yang sama, kita umumnya tidak mempunyai hukum distribusi apa pun. Menentukan karakteristik numerik suatu fungsi dari karakteristik numerik argumen tertentu banyak digunakan dalam teori probabilitas dan secara signifikan dapat menyederhanakan solusi sejumlah masalah. Sebagian besar metode yang disederhanakan ini berkaitan dengan fungsi linier; namun, beberapa fungsi nonlinier dasar juga memungkinkan pendekatan serupa.

Saat ini kami akan menyajikan sejumlah teorema tentang karakteristik numerik suatu fungsi, yang bersama-sama mewakili peralatan yang sangat sederhana untuk menghitung karakteristik ini, yang dapat diterapkan dalam berbagai kondisi.

1. Ekspektasi matematis terhadap nilai non-acak

Sifat yang dirumuskan cukup jelas; hal ini dapat dibuktikan dengan menganggap suatu variabel bukan acak sebagai jenis acak khusus, dengan satu nilai yang mungkin dengan probabilitas satu; maka menurut rumus umum ekspektasi matematis:

.

2. Varians suatu besaran yang tidak acak

Jika tidak nilai acak, Itu

3. Mengganti nilai non-acak dengan tanda ekspektasi matematis

, (10.2.1)

artinya, nilai non-acak dapat diambil sebagai tanda ekspektasi matematis.

Bukti.

a) Untuk jumlah yang terputus-putus

b) Untuk besaran kontinyu

.

4. Mengganti tanda dispersi dan deviasi standar dengan nilai non-acak

Jika merupakan besaran yang tidak acak, dan acak, maka

, (10.2.2)

artinya, nilai non-acak dapat dikeluarkan dari tanda dispersi dengan mengkuadratkannya.

Bukti. Menurut definisi varians

Konsekuensi

,

artinya, nilai non-acak dapat dikeluarkan dari tanda simpangan baku dengan nilai absolutnya. Kita memperoleh buktinya dengan mengambil akar kuadrat dari rumus (10.2.2) dan memperhitungkan bahwa r.s.o. - nilai positif signifikan.

5. Ekspektasi matematis dari jumlah variabel acak

Mari kita buktikan bahwa untuk dua variabel acak dan

yaitu nilai yang diharapkan jumlah dua variabel acak sama dengan jumlah ekspektasi matematisnya.

Sifat ini dikenal sebagai teorema penjumlahan ekspektasi matematis.

Bukti.

a) Misalkan suatu sistem variabel acak diskontinu. Mari kita terapkan rumus umum (10.1.6) pada jumlah variabel acak untuk ekspektasi matematis dari fungsi dua argumen:

.

Ho mewakili tidak lebih dari probabilitas total bahwa kuantitas tersebut akan bernilai :

;

karena itu,

.

Kami juga akan membuktikannya

,

dan teorema tersebut terbukti.

b) Misalkan suatu sistem peubah acak kontinu. Menurut rumus (10.1.7)

. (10.2.4)

Mari kita ubah integral pertama (10.2.4):

;

demikian pula

,

dan teorema tersebut terbukti.

Perlu dicatat secara khusus bahwa teorema penjumlahan ekspektasi matematis berlaku untuk semua variabel acak - baik dependen maupun independen.

Teorema untuk menjumlahkan ekspektasi matematis digeneralisasikan ke sejumlah istilah yang berubah-ubah:

, (10.2.5)

yaitu ekspektasi matematis dari jumlah beberapa variabel acak sama dengan jumlah ekspektasi matematisnya.

Untuk membuktikannya cukup menggunakan metode induksi lengkap.

6. Ekspektasi matematis fungsi linear

Pertimbangkan fungsi linier dari beberapa argumen acak:

di mana adalah koefisien non-acak. Mari kita buktikan itu

, (10.2.6)

yaitu ekspektasi matematis dari suatu fungsi linier sama dengan fungsi linier yang sama dari ekspektasi matematis argumennya.

Bukti. Menggunakan teorema penjumlahan m.o. dan aturan menempatkan besaran non-acak di luar tanda m.o., kita peroleh:

.

7. Tampilanhaljumlah variabel acak ini

Varians dari jumlah dua variabel acak sama dengan jumlah variansnya ditambah dua kali momen korelasi:

Bukti. Mari kita tunjukkan

Menurut teorema penjumlahan ekspektasi matematis

Mari beralih dari variabel acak ke variabel terpusat yang sesuai. Mengurangi persamaan (10.2.9) suku demi suku dari persamaan (10.2.8), kita mendapatkan:

Menurut definisi varians

Q.E.D.

Rumus (10.2.7) untuk varians suatu jumlah dapat digeneralisasikan ke sejumlah suku berapa pun:

, (10.2.10)

dimana adalah momen korelasi besaran, tanda di bawah penjumlahan berarti penjumlahan berlaku untuk semua kemungkinan kombinasi berpasangan variabel acak .

Pembuktiannya mirip dengan yang sebelumnya dan mengikuti rumus kuadrat polinomial.

Rumus (10.2.10) dapat ditulis dalam bentuk lain:

, (10.2.11)

dimana jumlah ganda meluas ke semua elemen matriks korelasi sistem besaran , berisi momen korelasi dan varians.

Jika semua variabel acak , termasuk dalam sistem, tidak berkorelasi (yaitu kapan ), rumus (10.2.10) berbentuk:

, (10.2.12)

yaitu, varians dari jumlah variabel acak yang tidak berkorelasi sama dengan jumlah varians dari suku-suku tersebut.

Posisi ini dikenal sebagai teorema penjumlahan varians.

8. Varians suatu fungsi linier

Mari kita perhatikan fungsi linier dari beberapa variabel acak.

dimana adalah besaran non-acak.

Mari kita buktikan bahwa dispersi fungsi linier ini dinyatakan dengan rumus

, (10.2.13)

dimana adalah momen korelasi besaran , .

Bukti. Mari kita perkenalkan notasinya:

. (10.2.14)

Menerapkan rumus (10.2.10) untuk dispersi jumlah ke ruas kanan ekspresi (10.2.14) dan dengan memperhitungkan bahwa , kita memperoleh:

dimana momen korelasi besaran:

.

Mari kita hitung momen ini. Kita punya:

;

demikian pula

Mengganti ekspresi ini ke (10.2.15), kita sampai pada rumus (10.2.13).

Dalam kasus khusus ketika semua kuantitas tidak berkorelasi, rumus (10.2.13) berbentuk:

, (10.2.16)

yaitu, varians fungsi linier dari variabel acak yang tidak berkorelasi sama dengan jumlah produk kuadrat koefisien dan varians dari argumen yang bersesuaian.

9. Ekspektasi matematis dari suatu produk variabel acak

Ekspektasi matematis dari hasil kali dua variabel acak sama dengan hasil kali ekspektasi matematisnya ditambah momen korelasi:

Bukti. Kita akan melanjutkan dari definisi momen korelasi:

Mari kita ubah ekspresi ini menggunakan properti ekspektasi matematis:

yang jelas setara dengan rumus (10.2.17).

Jika variabel acak tidak berkorelasi, maka rumus (10.2.17) berbentuk:

artinya, ekspektasi matematis dari hasil kali dua variabel acak yang tidak berkorelasi sama dengan hasil kali ekspektasi matematisnya.

Ketentuan ini dikenal dengan teorema perkalian ekspektasi matematis.

Rumus (10.2.17) tidak lebih dari ekspresi momen pusat campuran kedua dari sistem melalui momen awal campuran kedua dan ekspektasi matematis:

. (10.2.19)

Ungkapan ini sering digunakan dalam praktik ketika menghitung momen korelasi dengan cara yang sama seperti untuk satu variabel acak, variansnya sering dihitung melalui momen awal kedua dan ekspektasi matematis.

Teorema perkalian ekspektasi matematis digeneralisasikan ke sejumlah faktor yang berubah-ubah, hanya dalam hal ini, untuk penerapannya, tidak cukup besaran-besaran yang tidak berkorelasi, tetapi diperlukan beberapa momen campuran yang lebih tinggi, yang jumlahnya tergantung pada jumlah istilah dalam produk, lenyap. Kondisi ini tentu terpenuhi jika variabel acak yang dimasukkan dalam produk adalah independen. Pada kasus ini

, (10.2.20)

yaitu, ekspektasi matematis dari produk variabel acak independen sama dengan produk ekspektasi matematisnya.

Proposisi ini dapat dengan mudah dibuktikan dengan induksi lengkap.

10. Varians produk variabel acak independen

Mari kita buktikan untuk besaran bebas

Bukti. Mari kita nyatakan . Menurut definisi varians

Karena besarannya tidak bergantung pada, dan

Jika tidak bergantung, besarannya juga tidak bergantung; karena itu,

,

Tetapi tidak ada yang lain selain momen besaran awal kedua, dan oleh karena itu, dinyatakan melalui dispersi:

;

demikian pula

.

Mengganti ekspresi ini ke dalam rumus (10.2.22) dan membawa suku-suku serupa, kita sampai pada rumus (10.2.21).

Dalam kasus ketika variabel acak terpusat (variabel dengan ekspektasi matematis sama dengan nol) dikalikan, rumus (10.2.21) berbentuk:

, (10.2.23)

yaitu, varians hasil kali variabel acak terpusat independen sama dengan hasil kali variansnya.

11. Momen tertinggi dari jumlah variabel acak

Dalam beberapa kasus, perlu untuk menghitung momen tertinggi dari jumlah variabel acak independen. Mari kita buktikan beberapa hubungan terkait di sini.

1) Jika besaran-besaran tersebut bebas, maka

Bukti.

dari mana, menurut teorema perkalian ekspektasi matematika

Namun momen sentral pertama untuk besaran apa pun adalah nol; kedua suku tengahnya hilang, dan rumus (10.2.24) terbukti.

Relasi (10.2.24) mudah digeneralisasikan dengan induksi ke sejumlah suku independen:

. (10.2.25)

2) Momen sentral keempat dari penjumlahan dua peubah acak bebas dinyatakan dengan rumus

di mana varian besarannya dan .

Buktinya sangat mirip dengan yang sebelumnya.

Dengan menggunakan metode induksi lengkap, mudah untuk membuktikan generalisasi rumus (10.2.26) ke sejumlah suku independen yang berubah-ubah.

Mari kita hitungMSUNGGULvarians sampel dan deviasi standar. Kami juga akan menghitung varians suatu variabel acak jika distribusinya diketahui.

Mari kita pertimbangkan dulu penyebaran, Kemudian deviasi standar.

Varians sampel

Varians sampel (varians sampel,Sampelperbedaan) mencirikan penyebaran nilai dalam array relatif terhadap .

Ketiga rumus tersebut setara secara matematis.

Dari rumus pertama sudah jelas bahwa varians sampel adalah jumlah deviasi kuadrat setiap nilai dalam array dari rata-rata, dibagi dengan ukuran sampel dikurangi 1.

varians sampel fungsi DISP() digunakan, Bahasa Inggris. nama VAR, yaitu Perbedaan. Dari versi MS EXCEL 2010, disarankan untuk menggunakan analognya DISP.V(), Bahasa Inggris. nama VARS, yaitu Contoh VARIance. Selain itu, mulai versi MS EXCEL 2010, terdapat fungsi DISP.Г(), Bahasa Inggris. nama VARP, yaitu VARIance Populasi, yang menghitung penyebaran Untuk populasi. Perbedaannya terletak pada penyebutnya: alih-alih n-1 seperti DISP.V(), DISP.G() hanya memiliki n pada penyebutnya. Sebelum MS EXCEL 2010, fungsi VAR() digunakan untuk menghitung varians populasi.

Varians sampel
=QUADROTCL(Sampel)/(JUMLAH(Sampel)-1)
=(SUM(Sampel)-COUNT(Sampel)*RATA-RATA(Sampel)^2)/ (COUNT(Sampel)-1)– rumus biasa
=SUM((Sampel -RATA-RATA(Sampel))^2)/ (JUMLAH(Sampel)-1) –

Varians sampel sama dengan 0, hanya jika semua nilai sama satu sama lain dan, karenanya, sama nilai rata-rata. Biasanya semakin besar nilainya varians, semakin besar penyebaran nilai dalam array.

Varians sampel adalah perkiraan poin varians distribusi variabel acak dari mana variabel itu dibuat Sampel. Tentang konstruksi interval kepercayaan saat menilai varians bisa dibaca di artikel.

Varians dari variabel acak

Menghitung penyebaran variabel acak, Anda perlu mengetahuinya.

Untuk varians variabel acak X sering dinotasikan dengan Var(X). Penyebaran sama dengan kuadrat deviasi dari mean E(X): Var(X)=E[(X-E(X)) 2 ]

penyebaran dihitung dengan rumus:

dimana x i adalah nilai yang dapat diambil oleh suatu variabel acak, dan μ adalah nilai rata-rata (), p(x) adalah peluang bahwa variabel acak tersebut akan mengambil nilai x.

Jika suatu variabel acak mempunyai , maka penyebaran dihitung dengan rumus:

Dimensi varians sesuai dengan kuadrat satuan pengukuran nilai awal. Misalnya, jika nilai dalam sampel mewakili pengukuran berat suatu bagian (dalam kg), maka dimensi variansnya adalah kg 2 . Hal ini mungkin sulit untuk ditafsirkan, sehingga untuk mengkarakterisasi penyebaran nilai, nilai sama dengan akar kuadrat variansdeviasi standar.

Beberapa properti varians:

Var(X+a)=Var(X), dengan X adalah variabel acak dan a adalah konstanta.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Properti dispersi ini digunakan dalam artikel tentang regresi linier.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), dengan X dan Y adalah variabel acak, Cov(X;Y) adalah kovarians dari variabel acak tersebut.

Jika variabel acak bersifat independen, maka variabel tersebut kovarians sama dengan 0, dan oleh karena itu Var(X+Y)=Var(X)+Var(Y). Sifat dispersi ini digunakan dalam derivasi.

Mari kita tunjukkan bahwa untuk besaran bebas Var(X-Y)=Var(X+Y). Memang benar, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Properti dispersi ini digunakan untuk membangun.

Contoh simpangan baku

Contoh simpangan baku adalah ukuran seberapa luas nilai-nilai yang tersebar dalam suatu sampel relatif terhadapnya.

A-priori, deviasi standar sama dengan akar kuadrat dari varians:

Deviasi standar tidak memperhitungkan besarnya nilai dalam Sampel, tetapi hanya derajat penyebaran nilai-nilai di sekitarnya rata-rata. Untuk mengilustrasikannya, mari kita berikan sebuah contoh.

Mari kita hitung simpangan baku untuk 2 sampel: (1; 5; 9) dan (1001; 1005; 1009). Dalam kedua kasus, s=4. Jelas terlihat bahwa rasio deviasi standar terhadap nilai array berbeda secara signifikan antar sampel. Untuk kasus seperti itu digunakan Koefisien variasi(Koefisien Variasi, CV) - rasio Deviasi Standar ke rata-rata hitung, dinyatakan dalam persentase.

Di MS EXCEL 2007 dan versi sebelumnya untuk perhitungan Contoh simpangan baku fungsi =STDEVAL() digunakan, bahasa Inggris. nama STDEV, mis. Deviasi Standar. Dari versi MS EXCEL 2010 disarankan menggunakan analognya =STDEV.B() , Bahasa Inggris. nama STDEV.S, mis. Contoh DEVIASI STANDAR.

Selain itu, mulai versi MS EXCEL 2010, terdapat fungsi STANDARDEV.G(), Bahasa Inggris. nama STDEV.P, mis. DEVIASI Standar Populasi, yang menghitung deviasi standar Untuk populasi. Seluruh perbedaan terletak pada penyebutnya: alih-alih n-1 seperti pada STANDARDEV.V(), STANDARDEVAL.G() hanya memiliki n pada penyebutnya.

Deviasi standar bisa juga dihitung langsung menggunakan rumus di bawah ini (lihat contoh file)
=ROOT(QUADROTCL(Sampel)/(JUMLAH(Sampel)-1))
=ROOT((SUM(Sampel)-COUNT(Sampel)*RATA-RATA(Sampel)^2)/(COUNT(Sampel)-1))

Ukuran penyebaran lainnya

Fungsi SQUADROTCL() menghitung dengan jumlah kuadrat deviasi nilai darinya rata-rata. Fungsi ini akan mengembalikan hasil yang sama seperti rumus =DISP.G( Sampel)*MEMERIKSA( Sampel) , Di mana Sampel- referensi ke rentang yang berisi larik nilai sampel(). Perhitungan pada fungsi QUADROCL() dilakukan sesuai dengan rumus:

Fungsi SROTCL() juga merupakan ukuran penyebaran kumpulan data. Fungsi SROTCL() menghitung rata-rata nilai absolut dari deviasi nilai rata-rata. Fungsi ini akan mengembalikan hasil yang sama seperti rumus =SUMPRODUK(ABS(Sampel-RATA-RATA(Sampel)))/COUNT(Sampel), Di mana Sampel- tautan ke rentang yang berisi larik nilai sampel.

Perhitungan pada fungsi SROTCL() dilakukan sesuai dengan rumus:

Penyebaranvariabel acak- ukuran penyebaran suatu hal variabel acak, yaitu dia penyimpangan dari ekspektasi matematis. Dalam statistik, notasi (sigma kuadrat) sering digunakan untuk menunjukkan dispersi. Akar kuadrat dari varians yang sama disebut deviasi standar atau penyebaran standar. Deviasi standar diukur dalam satuan yang sama dengan variabel acak itu sendiri, dan variansnya diukur dalam kuadrat dari satuan tersebut.

Meskipun sangat mudah untuk menggunakan hanya satu nilai (seperti mean atau mode dan median) untuk memperkirakan keseluruhan sampel, pendekatan ini dapat dengan mudah menghasilkan kesimpulan yang salah. Alasan untuk situasi ini bukan terletak pada nilai itu sendiri, namun pada kenyataan bahwa satu nilai sama sekali tidak mencerminkan penyebaran nilai data.

Misalnya, dalam sampel:

nilai rata-ratanya adalah 5.

Namun, dalam sampel itu sendiri tidak ada satu pun elemen yang bernilai 5. Anda mungkin perlu mengetahui derajat kedekatan setiap elemen dalam sampel terhadap nilai rata-ratanya. Atau dengan kata lain, Anda perlu mengetahui varians nilainya. Mengetahui tingkat perubahan data, Anda dapat menafsirkannya dengan lebih baik nilai rata-rata, median Dan mode. Sejauh mana perubahan nilai sampel ditentukan dengan menghitung varians dan deviasi standarnya.



Varians dan Akar pangkat dua varians, yang disebut deviasi standar, mencirikan deviasi rata-rata dari mean sampel. Diantara dua besaran tersebut nilai tertinggi Memiliki deviasi standar. Nilai ini dapat dianggap sebagai jarak rata-rata elemen dari elemen tengah sampel.

Varians sulit untuk ditafsirkan secara bermakna. Namun, akar kuadrat dari nilai ini adalah simpangan baku dan dapat dengan mudah diinterpretasikan.

Simpangan baku dihitung dengan terlebih dahulu menentukan variansnya, kemudian mengambil akar kuadrat dari variansnya.

Misalnya, untuk array data yang ditunjukkan pada gambar, akan diperoleh nilai berikut:

Gambar 1

Disini nilai rata-rata selisih kuadratnya adalah 717,43. Untuk mendapatkan simpangan baku, yang tersisa hanyalah mengambil akar kuadrat dari bilangan tersebut.

Hasilnya kira-kira 26,78.

Ingatlah bahwa deviasi standar diartikan sebagai jarak rata-rata item dari mean sampel.

Deviasi standar mengukur seberapa baik mean menggambarkan keseluruhan sampel.

Katakanlah Anda seorang manajer Departemen produksi perakitan komputer. Laporan triwulanan menyatakan bahwa produksi pada kuartal terakhir adalah 2.500 PC. Apakah ini baik atau buruk? Anda meminta (atau sudah ada kolom ini di laporan) untuk menampilkan deviasi standar untuk data ini di laporan. Angka simpangan baku, misalnya, adalah 2000. Menjadi jelas bagi Anda, sebagai kepala departemen, bahwa lini produksi memerlukan manajemen yang lebih baik(penyimpangan terlalu besar dalam jumlah PC rakitan).

Ingatlah bahwa ketika deviasi standarnya besar, data tersebar luas di sekitar mean, dan ketika deviasi standarnya kecil, data-data tersebut berkelompok mendekati mean.

Empat fungsi statistik VAR(), VAR(), STDEV() dan STDEV() dirancang untuk menghitung varians dan deviasi standar angka dalam rentang sel. Sebelum Anda dapat menghitung varians dan deviasi standar suatu kumpulan data, Anda perlu menentukan apakah data tersebut mewakili suatu populasi atau sampel dari suatu populasi. Dalam kasus sampel dari populasi umum, Anda harus menggunakan fungsi VAR() dan STDEV(), dan dalam kasus populasi umum, fungsi VAR() dan STDEV():

Populasi Fungsi

DISPR()

STANDOTLONP()
Sampel

DISP()

STDEV()

Dispersi (serta deviasi standar), seperti yang telah kami catat, menunjukkan sejauh mana nilai-nilai yang termasuk dalam kumpulan data tersebar di sekitar mean aritmatika.

Nilai varians atau deviasi standar yang kecil menunjukkan bahwa semua data terkonsentrasi di sekitar mean aritmatika, dan sangat penting Nilai-nilai ini menunjukkan bahwa data tersebar pada rentang nilai yang luas.

Dispersi cukup sulit untuk diartikan secara bermakna (apa maksudnya nilai kecil, nilai besar?). Pertunjukan Tugas 3 akan memungkinkan Anda secara visual, dalam grafik, menunjukkan arti varians suatu kumpulan data.

Tugas

· Latihan 1.

· 2.1. Berikan konsep: dispersi dan simpangan baku; sebutan simbolisnya untuk pemrosesan data statistik.

· 2.2. Lengkapi lembar kerja sesuai dengan Gambar 1 dan buatlah perhitungan yang diperlukan.

· 2.3. Berikan rumus dasar yang digunakan dalam perhitungan

· 2.4. Jelaskan semua sebutan ( , , )

· 2.5. Jelaskan arti praktis dari konsep dispersi dan deviasi standar.

Tugas 2.

1.1. Berikan konsepnya: populasi umum dan sampel; ekspektasi matematis dan penunjukan simbolik rata-rata aritmatikanya untuk pemrosesan data statistik.

1.2. Sesuai Gambar 2, siapkan lembar kerja dan lakukan perhitungan.

1.3. Berikan rumus dasar yang digunakan dalam perhitungan (untuk populasi umum dan sampel).

Gambar 2

1.4. Jelaskan mengapa dimungkinkan untuk memperoleh nilai rata-rata aritmatika dalam sampel seperti 46,43 dan 48,78 (lihat file Lampiran). Menarik kesimpulan.

Tugas 3.

Ada dua sampel dengan kumpulan data berbeda, namun rata-ratanya akan sama:

Gambar 3

3.1. Lengkapi lembar kerja sesuai dengan Gambar 3 dan buatlah perhitungan yang diperlukan.

3.2. Berikan rumus perhitungan dasar.

3.3. Buatlah grafik sesuai dengan Gambar 4, 5.

3.4. Jelaskan ketergantungan yang diperoleh.

3.5. Lakukan perhitungan serupa untuk data dua sampel.

Sampel asli 11119999

Pilih nilai sampel kedua agar mean aritmatika sampel kedua sama, misalnya:

Pilih sendiri nilai untuk sampel kedua. Susunlah perhitungan dan grafiknya seperti Gambar 3, 4, 5. Tunjukkan rumus dasar yang digunakan dalam perhitungan.

Menarik kesimpulan yang tepat.

Selesaikan semua tugas dalam bentuk laporan dengan dilengkapi semua gambar, grafik, rumus dan penjelasan singkat yang diperlukan.

Catatan: konstruksi grafik harus dijelaskan dengan gambar dan penjelasan singkat.



Publikasi terkait