Paano Gumawa ng T Test sa Excel

Talaan ng mga Nilalaman:

Paano Gumawa ng T Test sa Excel
Paano Gumawa ng T Test sa Excel
Anonim

Ang Ang T-test ay isang paraan ng pagpapasya kung may istatistikal na makabuluhang pagkakaiba sa pagitan ng mga dataset, gamit ang t-distribution ng Student. Ang T-Test sa Excel ay isang dalawang-sample na T-test na naghahambing sa paraan ng dalawang sample. Ipinapaliwanag ng artikulong ito kung ano ang ibig sabihin ng istatistikal na kahalagahan at ipinapakita kung paano gumawa ng T-Test sa Excel.

Ang mga tagubilin sa artikulong ito ay nalalapat sa Excel 2019, 2016, 2013, 2010, 2007; Excel para sa Microsoft 365 at Excel Online.

Image
Image

Ano ang Statistical Significance?

Isipin na gusto mong malaman kung alin sa dalawang dice ang magbibigay ng mas magandang marka. I-roll mo ang unang mamatay at makakuha ng 2; i-roll mo ang pangalawang die at makakuha ng 6. Sinasabi ba nito sa iyo na ang pangalawang pagkamatay ay karaniwang nagbibigay ng mas mataas na mga marka? Kung sumagot ka ng, "Siyempre hindi," pagkatapos ay mayroon ka nang ilang pag-unawa sa istatistikal na kahalagahan. Nauunawaan mo na ang pagkakaiba ay dahil sa random na pagbabago sa marka, sa bawat oras na ang isang die ay pinagsama. Dahil napakaliit ng sample (isang roll lang) hindi ito nagpakita ng anumang makabuluhang bagay.

Ngayon isipin na 6 na beses mong pagulungin ang bawat patay:

  • Ang unang die ay gumulong ng 3, 6, 6, 4, 3, 3; Mean=4.17
  • Ang pangalawang die ay gumulong ng 5, 6, 2, 5, 2, 4; Mean=4.00

Napatunayan ba nito ngayon na ang unang pagkamatay ay nagbibigay ng mas mataas na marka kaysa sa pangalawa? Hindi siguro. Ang isang maliit na sample na may medyo maliit na pagkakaiba sa pagitan ng mga paraan ay malamang na ang pagkakaiba ay dahil pa rin sa mga random na pagkakaiba-iba. Habang dinadagdagan natin ang bilang ng mga dice roll, nagiging mahirap na magbigay ng common sense na sagot sa tanong - resulta ba ng random variation ang pagkakaiba sa pagitan ng mga score o mas malamang na magbigay ng mas mataas na score ang isa kaysa sa isa?

Ang Significance ay ang posibilidad na ang isang naobserbahang pagkakaiba sa pagitan ng mga sample ay dahil sa mga random na variation. Ang kahalagahan ay kadalasang tinatawag na antas ng alpha o simpleng 'α.' Ang antas ng kumpiyansa, o simpleng 'c,' ay ang posibilidad na ang pagkakaiba sa pagitan ng mga sample ay hindi dahil sa random na pagkakaiba-iba; sa madaling salita, na mayroong pagkakaiba sa pagitan ng mga pinagbabatayan na populasyon. Samakatuwid: c=1 – α

Maaari naming itakda ang 'α' sa anumang antas na gusto namin, para magkaroon ng kumpiyansa na napatunayan na namin ang kahalagahan. Kadalasang ginagamit ang α=5% (95% kumpiyansa), ngunit kung gusto nating makatiyak na ang anumang pagkakaiba ay hindi sanhi ng random na pagkakaiba-iba, maaari tayong maglapat ng mas mataas na antas ng kumpiyansa, gamit ang α=1% o kahit α=0.1 %.

Iba't ibang istatistikal na pagsubok ang ginagamit upang kalkulahin ang kahalagahan sa iba't ibang sitwasyon. Ginagamit ang mga T-test upang matukoy kung magkaiba ang ibig sabihin ng dalawang populasyon at ang mga F-test ay ginagamit upang matukoy kung magkaiba ang mga pagkakaiba.

Bakit Test para sa Statistical Significance?

Kapag naghahambing ng iba't ibang bagay, kailangan nating gumamit ng significance testing upang matukoy kung ang isa ay mas mahusay kaysa sa isa. Nalalapat ito sa maraming field, halimbawa:

  • Sa negosyo, kailangang paghambingin ng mga tao ang iba't ibang produkto at paraan ng marketing.
  • Sa sports, kailangang paghambingin ng mga tao ang iba't ibang kagamitan, diskarte, at kakumpitensya.
  • Sa engineering, kailangang paghambingin ng mga tao ang iba't ibang disenyo at setting ng parameter.

Kung gusto mong subukan kung ang isang bagay ay gumaganap nang mas mahusay kaysa sa ibang bagay, sa anumang larangan, kailangan mong subukan para sa istatistikal na kahalagahan.

Ano ang T-Distribution ng Mag-aaral?

Ang t-distribution ng Mag-aaral ay katulad ng normal (o Gaussian) distribution. Ang mga ito ay parehong hugis-bell na mga pamamahagi na may karamihan sa mga resulta na malapit sa average, ngunit ang ilang mga bihirang kaganapan ay medyo malayo sa mean sa parehong direksyon, na tinutukoy bilang mga buntot ng pamamahagi.

Ang eksaktong hugis ng t-distribution ng Estudyante ay depende sa laki ng sample. Para sa mga sample na higit sa 30 ito ay halos kapareho sa normal na distribusyon. Habang nababawasan ang laki ng sample, lumalaki ang mga buntot, na kumakatawan sa tumaas na kawalan ng katiyakan na nagmumula sa paggawa ng mga hinuha batay sa isang maliit na sample.

Paano Gumawa ng T-Test sa Excel

Bago ka makapag-apply ng T-Test para matukoy kung may makabuluhang pagkakaiba sa istatistika sa pagitan ng paraan ng dalawang sample, kailangan mo munang magsagawa ng F-Test. Ito ay dahil iba't ibang kalkulasyon ang ginagawa para sa T-Test depende sa kung may malaking pagkakaiba sa pagitan ng mga pagkakaiba.

Kakailanganin mo ang Analysis Toolpak add-in na pinagana upang maisagawa ang pagsusuring ito.

Pagsusuri at Paglo-load ng Analysis Toolpak Add-In

Para suriin at i-activate ang Analysis Toolpak sundin ang mga hakbang na ito:

  1. Piliin ang FILE tab >piliin ang Options.
  2. Sa dialog box ng Mga Opsyon, piliin ang Add-Ins mula sa mga tab sa kaliwang bahagi.
  3. Sa ibaba ng window, piliin ang drop-down na menu na Pamahalaan, pagkatapos ay piliin ang Excel Add-ins. Piliin ang Go.

    Image
    Image
  4. Tiyaking may check ang check-box sa tabi ng Analysis Toolpak, pagkatapos ay piliin ang OK.
  5. Aktibo na ngayon ang Analysis Toolpak at handa ka nang maglapat ng F-Test at T-Test.

Pagsasagawa ng F-Test at T-Test sa Excel

  1. Maglagay ng dalawang dataset sa isang spreadsheet. Sa kasong ito, isinasaalang-alang namin ang mga benta ng dalawang produkto sa loob ng isang linggo. Kinakalkula din ang average na pang-araw-araw na halaga ng benta para sa bawat produkto, kasama ang karaniwang paglihis nito.

    Image
    Image
  2. Piliin ang tab na Data > Pagsusuri ng Data

    Image
    Image
  3. Piliin ang F-Test Two-Sample for Variances mula sa listahan, pagkatapos ay piliin ang OK.

    Image
    Image

    Ang F-Test ay lubos na sensitibo sa hindi normalidad. Samakatuwid, maaaring mas ligtas na gumamit ng Welch test, ngunit mas mahirap ito sa Excel.

  4. Piliin ang Variable 1 Range at Variable 2 Range; itakda ang Alpha (0.05 ay nagbibigay ng 95% kumpiyansa); pumili ng cell para sa kaliwang sulok sa itaas ng output, isinasaalang-alang na pupunuin nito ang 3 column at 10 row. Piliin ang OK.

    Image
    Image

    Para sa para sa Variable 1 Range, dapat piliin ang sample na may pinakamalaking standard deviation (o variance).

  5. Tingnan ang mga resulta ng F-Test upang matukoy kung may makabuluhang pagkakaiba sa pagitan ng mga pagkakaiba. Nagbibigay ang mga resulta ng tatlong mahahalagang halaga:

    • F: Ang ratio sa pagitan ng mga pagkakaiba.
    • P(F<=f) one-tail: Ang posibilidad na ang variable 1 ay walang aktwal na mas malaking pagkakaiba kaysa sa variable 2. Kung ito ay mas malaki kaysa sa alpha, na sa pangkalahatan ay 0.05, pagkatapos ay walang makabuluhang pagkakaiba sa pagitan ng mga pagkakaiba.
    • F Kritikal na isang buntot: Ang halaga ng F na kakailanganin upang magbigay ng P(F<=f)=α. Kung mas malaki ang value na ito sa F, ipinapahiwatig din nito na walang makabuluhang pagkakaiba sa pagitan ng mga pagkakaiba.

    Ang P(F<=f) ay maaari ding kalkulahin gamit ang FDIST function na may F at ang mga degree ng kalayaan para sa bawat sample bilang mga input nito. Ang mga antas ng kalayaan ay ang bilang lamang ng mga obserbasyon sa isang sample na binawasan ng isa.

  6. Ngayong alam mo na kung may pagkakaiba sa pagitan ng mga pagkakaiba, maaari mong piliin ang naaangkop na T-Test. Piliin ang tab na Data > Data Analysis, pagkatapos ay piliin ang alinman sa t-Test: Two-Sample Assuming Equal Varianceso t-Test: Dalawang-Sample na Ipinapalagay na Hindi Pantay na Pagkakaiba

    Image
    Image
  7. Anumang opsyon ang pinili mo sa nakaraang hakbang, ipapakita sa iyo ang parehong dialogue box para ilagay ang mga detalye ng pagsusuri. Upang magsimula, piliin ang mga hanay na naglalaman ng mga sample para sa Variable 1 Range at Variable 2 Range.

    Image
    Image
  8. Ipagpalagay na gusto mong subukan kung walang pagkakaiba sa pagitan ng mga paraan, itakda ang Hypothesized Mean Difference sa zero.
  9. Itakda ang antas ng kabuluhan na Alpha (0.05 ang nagbibigay ng 95% kumpiyansa), at pumili ng cell para sa kaliwang sulok sa itaas ng output, kung isasaalang-alang na pupunuin nito ang 3 column at 14 na row. Piliin ang OK.
  10. Suriin ang mga resulta upang magpasya kung may malaking pagkakaiba sa pagitan ng mga paraan.

    Tulad ng sa F-Test, kung ang p-value, sa kasong ito P(T<=t), ay mas malaki kaysa sa alpha, walang makabuluhang pagkakaiba. Gayunpaman, sa kasong ito mayroong dalawang p-values na ibinigay, ang isa para sa isang pagsubok na isang buntot at ang isa para sa isang pagsubok na may dalawang buntot. Sa kasong ito, gamitin ang two-tail value dahil ang alinmang variable na may mas malaking mean ay magiging isang makabuluhang pagkakaiba.

Inirerekumendang: