Wéi Emissiounen ze berechnen

Auteur: Janice Evans
Denlaod Vun Der Kreatioun: 23 Juli 2021
Update Datum: 1 Juli 2024
Anonim
Modul 9: Tools zur Klimabilanzierung – CO2 Rechner für Unternehmen
Videospiller: Modul 9: Tools zur Klimabilanzierung – CO2 Rechner für Unternehmen

Inhalt

An de Statistike sinn Ausfäller Wäerter déi sech staark vun anere Wäerter am gesammelten Dataset ënnerscheeden. En Ausleefer kann Anomalien an der Datenverdeelung oder Messfehler uginn, sou datt Auslänner dacks aus dem Dataset ausgeschloss sinn. Andeems Dir Auslänner aus dem Dataset eliminéiert, kënnt Dir op onerwaart oder méi präzis Conclusioune kommen. Dofir ass et noutwendeg fir Auslänner ze berechnen an ze schätzen fir e korrekt Verständnis vun de Statistiken ze garantéieren.

Schrëtt

  1. 1 Léiert potenziell Auslänner z'erkennen. Potenziell Ausfäller solle identifizéiert ginn ier Ausgrenzungen aus dem Dataset ausgeschloss ginn. Auslänner si Wäerter déi ganz anescht si wéi déi meescht vun de Wäerter am Dataset; an anere Wierder, Auslänner sinn ausserhalb vum Trend vun de meeschte Wäerter. Dëst ass einfach an Tabelle vu Wäerter oder (besonnesch) a Grafike ze fannen. Wann d'Wäerter an der Dataset geplot sinn, leien d'Ausfäller wäit vun de meeschte anere Wäerter. Wann, zum Beispill, déi meescht vun de Wäerter op enger riichter Linn falen, da leien d'Ausfäller op béide Säiten vun esou enger riichter Linn.
    • Zum Beispill, betruecht eng Dataset, déi d'Temperaturen vun 12 verschiddenen Objeten an engem Raum duerstellt. Wann 11 Objekter ongeféier 70 Grad sinn, awer den zwieleften Objet (méiglecherweis en Uewen) 300 Grad ass, da kann e séiere Bléck op d'Wäerter uginn datt den Uewen e wahrscheinlech Ausbléck ass.
  2. 2 Sortéiert d'Donnéeën an opsteigend Uerdnung. Den éischte Schrëtt bei der Bestëmmung vun Auslänner ass d'Median vun der Datebank ze berechnen. Dës Aufgab ass immens vereinfacht wann d'Wäerter am Dataset an opsteigender Uerdnung arrangéiert sinn (vu klengste bis gréisst).
    • Fuert mam uewe genannte Beispill, betruecht de folgenden Dataset, deen d'Temperaturen vu multiple Objete representéiert: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Dëse Set soll wéi follegt bestallt ginn: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 Berechent de Median vum Dataset. De Median vun engem Dataset ass de Wäert an der Mëtt vum Dataset. Wann d'Dataset eng komesch Unzuel vu Wäerter enthält, ass de Median de Wäert viru an duerno ginn et déiselwecht Zuel vu Wäerter am Dataset. Awer wann d'Dataset eng gläich Zuel vu Wäerter enthält, da musst Dir dat arithmetescht Mëttel vun deenen zwee Mëttele fannen. Notéiert datt wann Dir Auslänner berechent, gëtt de Median normalerweis als Q2 bezeechent, well se tëscht Q1 a Q3 läit, déi ënnescht an iewescht Quartil, déi mir méi spéit definéieren.
    • Hutt keng Angscht mat Datesätz ze schaffen déi eng gläich Zuel vu Wäerter hunn- den arithmetesche Mëttel vun deenen zwee Mëttele wäert eng Zuel sinn déi net am Dataset ass; dëst ass normal. Awer wann déi zwee mëttlere Wäerter déiselwecht Zuel sinn, dann ass dat arithmetescht Mëttel gläich mat dëser Zuel; dëst ass och an der Uerdnung vun de Saachen.
    • Am Beispill uewen sinn déi mëttlere 2 Wäerter 70 a 71, sou datt de Median ass ((70 + 71) / 2) = 70,5.
  4. 4 Berechent déi ënnescht Quartil. Dëse Wäert, bezeechent als Q1, ass ënner deem 25% vun den Datensetwäerter leien. An anere Wierder, et ass d'Halschent vun de Wäerter bis zum Median. Wann et eng gläich Unzuel vu Wäerter aus dem Dataset virum Median ass, musst Dir den arithmetesche Mëttel vun deenen zwee Mëttele fannen fir Q1 ze berechnen (dëst ass ähnlech wéi d'Berechnung vum Median).
    • An eisem Beispill si 6 Wäerter nom Median a 6 Wäerter- virun et. Dëst bedeit datt fir den ënneschten Quartil ze berechnen, musse mir den arithmetesche Mëttel vun den zwee Mëttele vun de sechs Wäerter fannen, déi virum Median leien. Hei sinn d'Duerchschnëttswäerter 70 a 70. Also Q1 = ((70 + 70) / 2) = 70.
  5. 5 Berechent den ieweschte Quartil. Dëse Wäert, bezeechent als Q3, ass iwwer deem 25% vun den Datensetwäerter leien. De Prozess fir de Q3 ze berechnen ass ähnlech wéi de Prozess fir de Q1 ze berechnen, awer hei ginn d'Wäerter nom Median ugesinn.
    • Am Beispill hei uewen sinn déi zwee Duerchschnëtt vun de sechs nom Median 71 an 72. Also Q3 = ((71 + 72) / 2) = 71,5.
  6. 6 Berechent den interquartile Beräich. Nodeems mir Q1 a Q3 berechent hunn, ass et néideg d'Distanz tëscht dëse Wäerter ze fannen. Fir dëst ze maachen, subtract Q1 from Q3. De Wäert vum interquartile Beräich ass extrem wichteg fir d'Grenze vu Wäerter ze bestëmmen déi net Auslänner sinn.
    • An eisem Beispill Q1 = 70 an Q3 = 71,5. Den interquartile Beräich ass 71,5 - 70 = 1,5.
    • Notéiert datt dëst och fir negativ Q1 a Q3 Wäerter gëllt. Zum Beispill, wann Q1 = -70, dann ass den interquartile Beräich 71,5 -(-70) = 141,5.
  7. 7 Fannt déi "bannescht Grenzen" vun de Wäerter am Dataset. Auslänner ginn bestëmmt andeems d'Wäerter analyséiert ginn- ob se an de sougenannten "bannenzege Grenzen" an "baussenzege Grenzen" falen oder net. E Wäert ausserhalb vun den "banneschten Grenzen" gëtt als "klengen Ausfall" klasséiert, wärend e Wäert ausserhalb vun de "baussenzege Grenzen" als "bedeitende Ausfall" klasséiert ass. Fir déi bannenzeg Grenzen ze fannen, musst Dir den interquartile Beräich mat 1,5 multiplizéieren; d'Resultat muss op Q3 derbäigesat ginn a vum Q1 ofgezu ginn. Déi zwee fonnt Zuelen sinn déi bannenzeg Grenze vum Dataset.
    • An eisem Beispill ass den interquartile Beräich (71.5 - 70) = 1.5. Weider: 1.5 * 1.5 = 2.25. Dës Zuel muss op Q3 derbäigesat ginn a vum Q1 ofgezunn ginn fir déi bannenzeg Grenzen ze fannen:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • Also sinn déi intern Grenzen 67,75 an 73,75.
    • An eisem Beispill läit nëmmen d'Uewenstemperatur - 300 Grad - ausserhalb vun dëse Grenzen a kann als eng bedeitend Emissioun ugesi ginn. Awer spréngt net zu Conclusiounen - mir musse feststellen ob dës Temperatur e wesentlechen Ausléiser ass.
  8. 8 Fannt déi "baussenzeg Grenzen" vum Dataset. Dëst gëtt op déiselwecht Manéier gemaach wéi fir bannenzeg Grenzen, ausser datt den interquartile Beräich mat 3 multiplizéiert gëtt amplaz vun 1,5. D'Resultat muss op Q3 derbäigesat ginn a vum Q1 ofgezunn ginn. Déi zwou fonnt Zuelen sinn déi baussenzeg Grenze vum Dataset.
    • An eisem Beispill multiplizéiert den interquartile Beräich mat 3: 1,5 * 3 = 4,5. Berechent déi baussenzeg Grenzen:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • Also déi baussenzeg Grenze si 65,5 a 76.
    • All Wäerter déi ausserhalb vun de baussenzege Grenze falen, ginn als bedeitend Emissiounen ugesinn. An eisem Beispill gëtt eng Uewenstemperatur vun 300 Grad als e bedeitende Ausbroch ugesinn.
  9. 9 Benotzt eng qualitativ Schätzung fir festzestellen ob Auslänner aus dem Dataset ausgeschloss solle ginn. D'Method uewe beschriwwen erlaabt Iech ze bestëmmen ob e puer Wäerter Auslänner sinn (kleng oder bedeitend). Maacht awer kee Feeler - e Wäert deen als Ausléiser klasséiert ass ass nëmmen e "Kandidat" fir eng Ausnam, dat heescht datt Dir et net auszeschléissen musst. D'Ursaach vum Ausléiser ass den Haaptfaktor deen d'Decisioun beaflosst fir den Ausléiser auszeschléissen. In der Regel sinn Auslänner, déi wéinst Feeler optrieden (a Miessungen, Opzeechnungen, asw.) Ausgeschloss. Op der anerer Säit, Auslänner verbonne mat Feeler, awer mat neien Informatioun oder Trend ginn normalerweis am Dataset hannerlooss.
    • Et ass gläich wichteg den Effekt vun Ausfäll op de Median vum Dataset ze bewäerten (egal ob se et verzerren oder net). Dëst ass besonnesch wichteg wann Dir Conclusiounen aus dem Median vun engem Datasaz zitt.
    • An eisem Beispill ass et extrem onwahrscheinlech datt den Uewen op eng Temperatur vun 300 Grad erhëtzt (ausser mir berücksichtegen natierlech Anomalien). Dofir kann et ofgeschloss ginn (mat engem héije Grad vu Sécherheet) datt sou eng Temperatur e Messfehler ass deen aus dem Datasaz ausgeschloss muss ginn. Ausserdeem, wann Dir den Ausleefer net ausschléisst, ass de Median vum Dataset (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 Grad, awer wann Dir den Ausleefer ausgeschloss hutt, ass de Median (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 Grad.
      • Outliers sinn normalerweis d'Resultat vu mënschleche Feeler, sou datt Outliers aus Datensätz ausgeschloss musse ginn.
  10. 10 Verstinn d'Wichtegkeet vun den (heiansdo) Auslänner, déi am Dataset bleiwen. E puer Auslänner solle vum Datasaz ausgeschloss ginn well se wéinst Feeler an technesche Probleemer sinn; aner Ausfäller sollen am Dataset bleiwen. Wann, zum Beispill, en Ausléiser net d'Resultat vun engem Feeler ass an / oder en neit Verständnis vum Phänomen gëtt deen ze testen ass, da sollt et an der Dataset bleiwen. Wëssenschaftlech Experimenter si besonnesch empfindlech op Auslänner - andeems Dir en Ausfall falsch eliminéiert hutt, verpasst Dir vläicht en neien Trend oder Entdeckung.
    • Zum Beispill entwéckele mir en neit Medikament fir d'Gréisst vum Fësch an der Fëscherei ze erhéijen. Mir benotzen den alen Datasaz ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), awer dës Kéier wäert all Wäert d'Gewiicht vum Fësch duerstellen (a Gramm) no der Intake experimentell Medikamenter. An anere Wierder, dat éischt Medikament féiert zu enger Erhéijung vum Fëschgewiicht bis 71 g, dat zweet Medikament - bis zu 70 g, a sou weider. An dëser Situatioun ass 300 e bedeitende Ausfall, awer mir däerfen et net ausschléissen; wa mir dovun ausgoen datt et keng Messfeeler waren, dann ass sou en Ausfall e wesentlechen Erfolleg am Experiment. D'Drogen, déi d'Gewiicht vum Fësch op 300 Gramm erhéicht hunn, funktionnéiert vill besser wéi aner Medikamenter; also 300 ass dee wichtegste Wäert am Dataset.

Tipps

  • Wann Auslänner fonnt ginn, probéiert hir Präsenz z'erklären ier se aus dem Dataset ausgeschloss ginn. Si kënne Moossfeeler oder Verdeelungsanomalien uginn.

Wat brauchs du

  • Rechner