Ang Pagkabigo ng Facebook ay Ipinapakita Kung Bakit Hindi Natin Dapat Umasa Dito para sa Lahat

Talaan ng mga Nilalaman:

Ang Pagkabigo ng Facebook ay Ipinapakita Kung Bakit Hindi Natin Dapat Umasa Dito para sa Lahat
Ang Pagkabigo ng Facebook ay Ipinapakita Kung Bakit Hindi Natin Dapat Umasa Dito para sa Lahat
Anonim

Mga Key Takeaway

  • Nakakalungkot ang mga teknikal na problema ng Facebook, ngunit malamang na mas mabilis na naresolba ang problema kung hindi ito umaasa sa napakaraming magkakaugnay na system.
  • Walang paraan upang ganap na maiwasan ang mga pagkabigo ng system, ngunit may mga paraan upang gawing mas maliit ang mga ito.
  • Ang pagkakaroon ng mga backup na plano para sa kung kailan (hindi kung, kapag) nabigo ang isang system ay maaaring gumawa ng pagkakaiba sa pagitan ng 'nakakainis' at 'kasakuna.'
Image
Image

Ipinapakita ng kamakailang problema sa Facebook kung paano mabibigo ang magkakaugnay na mga system at kung bakit hindi natin dapat gamitin ang mga ito para sa lahat.

Ang pagkawala ng Facebook, WhatsApp, at Instagram sa loob ng ilang oras noong Lunes ay hindi maginhawa, nakakapinsala sa mga negosyo, at sa ilang mga kaso, halos sakuna. Ayon sa Facebook, lahat ito ay dahil sa mga pagbabago sa configuration sa mga network coordinating router nito.

Ito ay isang makatwirang paliwanag, ngunit ang katotohanan na ang isang error na tulad nito ay maaaring magpahinto hindi lamang sa Facebook kundi sa iba pang mga sistema ng pag-aari ng Facebook na huminto ay medyo nakakaalarma.

Isang maling pagbabago sa config ng router ang nagdulot ng maraming serbisyo, at maging ang mga VR headset, na tuluyang tumigil sa paggana. Higit pa rito, sa pamamagitan ng sariling pag-amin ng Facebook, nagkaroon din ito ng cascading effect sa kung paano nakikipag-ugnayan ang mga data center ng kumpanya, na pinahinto ang lahat ng kanilang mga serbisyo.

"Ang pag-asa sa magkakaugnay na mga system ay nagdadala ng isang likas na panganib ng sistema o kahit na pagkabigo ng serbisyo," sabi ni Francesco Altomare, senior technical sales engineer sa GlobalDots, sa isang email na panayam sa Lifewire, "Upang labanan ang nakakatakot na panganib na ito, ginagamit ng mga kumpanya ang prinsipyo ng SRE (System Reliability Engineering), gayundin ang iba pang mga tool, na lahat ay tumatalakay sa iba't ibang antas ng redundancy na binuo sa bawat layer ng imprastraktura ng isang system."

Image
Image

Ano ang Maaaring Magkamali

Nararapat tandaan na kapag ang isang sistemang tulad nito ay nabigo, kadalasan ay nangangailangan ito ng isang perpektong bagyo ng mga bagay na nangyayaring mali. Ito ay hindi katulad ng isang bahay ng mga baraha na naghihintay na mahulog at mas katulad ng isang nakalantad na thermal exhaust port sa isang space station na kasing laki ng isang maliit na buwan.

Karamihan sa mga kumpanya ay gumagawa ng mga hakbang upang subukan at matiyak na ang isang bagay na maaaring magdulot ng kaguluhan sa lahat ay hindi kailanman mangyayari-ngunit anuman, maaari itong mangyari.

"Ang mga hindi inaasahang kabiguan ay bahagi ng negosyo at maaaring lumitaw bilang resulta ng kapabayaan ng manggagawa, mga pagkakamali sa network ng internet service provider, o kahit na mga serbisyo sa cloud storage na sumasailalim sa mga isyu," sabi ni Sally Stevens, co-founder ng FastPeopleSearch, sa isang panayam sa email.

"…Hangga't ang mga kinakailangang hakbang upang maprotektahan ang system-gaya ng mga backup, on-site na router, at tiered na access-ay inilalagay, ang mga pagkabigo na ito ay medyo malabong." Kahit na may hukbo ng mga fail-safe, posible pa ring mabigo ang lynchpin.

Kung mabigo ang system na kumokontrol sa mga bagay tulad ng mga pangunahing paraan ng pakikipag-ugnayan, appliances, pinto, atbp., maaaring maging makabuluhan ang mga resulta. Mula sa banayad na abala hanggang sa ganap na sakuna, depende sa kung gaano kalaki ang mga indibidwal at kumpanya na umaasa sa lahat ng ito.

Image
Image

"Mayroon ding panganib na makapasok ang mga hacker sa system mula sa alinman sa mga device na hindi gaanong pinoprotektahan, gaya ng mga refrigerator at oven toaster," dagdag ni Stevens, "na maaaring humantong sa pagnanakaw ng data at ransomware."

Paano Kami Maghahanda

Walang paraan upang matiyak na hindi kailanman mabibigo ang isang system, ngunit may mga hakbang na maaaring gawin upang gawing mas maliit ang posibilidad na mabigo o matugunan ang pagkabigo nang mas maayos. Ang kumbinasyon ng dalawang diskarte na nagpakasal sa mga fail-safe at countermeasures na may mga contingency plan at backup system ay magiging perpekto.

"Para maalis ang mga panganib na ito na nilikha ng mga third-party na produkto at serbisyo na epektibong pinangangasiwaan, ang mga tungkulin at tungkulin tungkol sa Third-Party Risk Management ay dapat na mahigpit na nakabalangkas," sabi ni Daniela Sawyer, tagapagtatag at punong opisyal ng teknolohiya ng FindPeopleFast, sa isang panayam sa email, "Upang umunlad sa mga bagong kapaligirang ito, dapat maunawaan ng mga risk manager ang mahahalagang bahagi ng gayong sopistikadong ecosystem."

Ang nangyari sa Facebook, WhatsApp, at Instagram ay nakakalungkot, ngunit sana ay nakabukas din ang mata. Ang mga taong umaasa sa magkakaugnay na mga sistema ay dapat na maunawaan na ang tamang bagay na mali ay maaaring makagambala sa lahat. At dapat na maisagawa ang mga hakbang (o masuri at pinuhin) upang gawing mas malamang at hindi gaanong maapektuhan ang mga ganitong pagkagambala.

Sa kaso ng Facebook, ang problema nito ay hindi ang mga problema sa router, kundi ang pagkakaroon ng halos buong ecosystem nito na konektado sa lahat ng iba pa. Kaya, sa pagbagsak ng Facebook (ang serbisyo), ang Facebook (ang kumpanya) ay kailangang gumugol ng mas maraming oras at lakas sa simpleng pag-aayos at pagtugon sa isyu. Kung hindi ito gumamit ng ganoong malalim na pinag-ugatan, magkakaugnay na sistema o nagkaroon ng mga backup na plano para harapin ang isang pagkasira na tulad nito, malamang na magtagal ito ng mas kaunting oras upang ayusin.

Inirerekumendang: