Ang Regression sa Excel ay isang paraan upang i-automate ang istatistikal na proseso ng paghahambing ng ilang hanay ng impormasyon upang makita kung paano nakakaapekto ang mga pagbabago sa mga independent variable sa mga pagbabago sa mga dependent variable. Kung gusto mo nang makahanap ng ugnayan sa pagitan ng dalawang bagay, ang paggamit ng regression analysis sa Excel ay isa sa mga pinakamahusay na paraan para gawin iyon.
Nalalapat ang mga tagubilin sa artikulong ito sa Excel 2019, Excel 2016, Excel 2013, Excel 2010.
Ano ang Kahulugan ng Regression?
Ang regression ay isang statistical modelling approach na ginagamit ng mga analyst para matukoy ang mga ugnayan sa pagitan ng maraming variable.
Nagsisimula ang pagsusuri ng regression sa isang variable na sinusubukan mong suriin at mga independent variable na sinusubukan mo upang makita kung nakakaapekto ang mga ito sa iisang variable na iyon. Tinitingnan ng pagsusuri ang mga pagbabago sa mga independyenteng variable at sinusubukang iugnay ang mga pagbabagong iyon sa mga nagresultang pagbabago sa iisang (dependent) na variable.
Maaaring parang mga advanced na istatistika ito, ngunit ginagawang available ng Excel ang kumplikadong pagsusuring ito sa sinuman.
Pagganap ng Linear Regression sa Excel
Ang pinakasimpleng anyo ng pagsusuri ng regression ay linear regression. Ang simpleng linear regression ay tumitingin sa relasyon sa pagitan ng dalawang variable lamang.
Halimbawa, ipinapakita ng sumusunod na spreadsheet ang data na naglalaman ng bilang ng mga calorie na kinakain ng isang tao bawat araw at ang kanilang timbang sa araw na iyon.
Dahil ang spreadsheet na ito ay naglalaman ng dalawang column ng data, at ang isang variable ay posibleng magkaroon ng epekto sa isa pa, maaari kang magpatakbo ng regression analysis sa data na ito gamit ang Excel.
Pagpapagana ng Add-On ng ToolPak ng Pagsusuri
Bago mo magamit ang feature ng regression analysis ng Excel, kailangan mong paganahin ang Add-on ng Analysis ToolPak sa screen ng Excel Options.
-
Sa Excel, piliin ang File menu at piliin ang Options.
-
Piliin ang Add-in sa kaliwang menu ng navigation. Pagkatapos, tiyaking napili ang Excel Add-in sa field na Pamahalaan.
-
Sa wakas, piliin ang Go na button.
-
Sa Add-in na pop-up window. Paganahin ang Analysis ToolPack sa pamamagitan ng pag-click sa kahon sa harap nito upang magdagdag ng check mark at piliin ang OK.
Ngayong naka-enable na ang Analysis ToolPak, handa ka nang magsimulang magsagawa ng regression analysis sa Excel.
Paano Magsagawa ng Simple Linear Regression sa Excel
Gamit ang timbang at calorie spreadsheet bilang halimbawa, maaari kang magsagawa ng linear regression analysis sa Excel gaya ng sumusunod.
-
Piliin ang Data menu. Pagkatapos, sa pangkat na Analysis, piliin ang Data Analysis.
-
Sa Data Analysis window, piliin ang Regression mula sa listahan at i-click ang OK.
-
Ang Input Y Range ay ang hanay ng mga cell na naglalaman ng dependent variable. Sa halimbawang ito, iyon ang bigat. Ang Input X Range ay ang hanay ng mga cell na naglalaman ng independent variable. Sa halimbawang ito, iyon ang calorie column.
-
Piliin ang Labels para sa mga cell ng header, at pagkatapos ay piliin ang Bagong Worksheet upang ipadala ang mga resulta sa isang bagong worksheet. Piliin ang OK upang patakbuhin ng Excel ang pagsusuri at ipadala ang mga resulta sa isang bagong sheet.
-
Suriin ang bagong worksheet. Ang output ng pagsusuri ay may ilang halaga na kailangan mong maunawaan upang bigyang-kahulugan ang mga resulta.
Ang bawat isa sa mga numerong ito ay may mga sumusunod na kahulugan:
- Multiple R: Ang Correlation Coefficient. Ang 1 ay nagpapahiwatig ng isang malakas na ugnayan sa pagitan ng dalawang variable, habang ang -1 ay nangangahulugan na mayroong isang malakas na negatibong relasyon. 0 ay nangangahulugang walang ugnayan.
- R Square: Ang Coefficient of Determination, na nagpapakita kung gaano karaming puntos sa pagitan ng dalawang variable ang nasa linya ng regression. Ayon sa istatistika, ito ang kabuuan ng mga squared deviations mula sa mean.
- Naayos na R Square: Isang istatistikal na value na tinatawag na R square na inaayos para sa bilang ng mga independent variable na iyong napili.
- Standard Error: Gaano katumpak ang mga resulta ng pagsusuri ng regression. Kung maliit ang error na ito, mas tumpak ang iyong mga resulta ng regression.
- Obserbasyon: Ang bilang ng mga obserbasyon sa iyong regression model.
Ang natitirang mga value sa regression output ay nagbibigay sa iyo ng mga detalye tungkol sa mas maliliit na bahagi sa regression analysis.
- df: Istatistikong halaga na kilala bilang mga antas ng kalayaan na nauugnay sa mga pinagmumulan ng pagkakaiba.
- SS: Kabuuan ng mga parisukat. Ang ratio ng natitirang kabuuan ng mga parisukat kumpara sa kabuuang SS ay dapat na mas maliit kung ang karamihan sa iyong data ay umaangkop sa linya ng regression.
- MS: Mean square ng data ng regression.
- F: Ang F statistic (F-test) para sa null hypothesis. Nagbibigay ito ng kahalagahan ng modelo ng regression.
- Significance F: Statistical value na kilala bilang P-value ng F.
Maliban kung naiintindihan mo ang mga istatistika at pagkalkula ng mga modelo ng regression, ang mga halaga sa ibaba ng buod ay hindi magkakaroon ng maraming kahulugan. Gayunpaman, ang Multiple R at R Square ang dalawang pinakamahalaga.
Tulad ng nakikita mo, sa halimbawang ito, ang mga calorie ay may malakas na ugnayan sa kabuuang timbang.
Multiple Linear Regression Analysis sa Excel
Upang maisagawa ang parehong linear regression ngunit may maraming independent variable, piliin ang buong hanay (maraming column at row) para sa Input X Range.
Kapag pumipili ng maraming independent variable, mas maliit ang posibilidad na makakita ka ng kasing lakas ng ugnayan dahil napakaraming variable.
Gayunpaman, makakatulong sa iyo ang pagsusuri ng regression sa Excel na makahanap ng mga ugnayan sa isa o higit pa sa mga variable na iyon na maaaring hindi mo napagtanto na umiiral lamang sa pamamagitan ng manu-manong pagsusuri sa data.