Hvordan ekskludere ekstreme verdier fra statistikken din

Innholdsfortegnelse

Beregningen av gjennomsnittet sier vanligvis mye om et datasett. Imidlertid er datavolumer med ekstreme ekstremer problematiske, ettersom disse kan påvirke og forfalse resultatet betydelig.

Du kan holde slike utfall utenfor beregningene dine. Da vil kjernedataene få større betydning i evalueringen. Illustrasjon [1] viser en tabell der gjennomsnittsverdien beregnes for hver kolonne.

På grunn av de negative verdiene på dag 2 og 4, er disse gjennomsnittsverdiene svært lave. På dag 1 og 5 resulterer imidlertid svært høye verdier i spesielt høye gjennomsnittsverdier.

For å beregne gjennomsnittsverdier uten avvik, bruk funksjonen TRIMMING MEANS. For å gjøre dette, skriv inn følgende formel i celle B16, og etter å ha angitt den, kopier formelen til cellene C16: F16:
= TRIMMINGSMEDIUM (B4: B13; 0,2)

Middelverdiene er nå mye nærmere hverandre fordi ekstreme verdier ikke blir tatt i betraktning. [2]

Du sender to argumenter til tabellfunksjonen ROUTED GENNOMGANG: Det første argumentet angir området du vil beregne gjennomsnittet i. Pass en verdi mellom 0 og 1 eller mellom 0% og 100% som det andre argumentet. Dette lar deg bestemme hvilken del av datavolumet som ikke skal inkluderes i beregningen. De høyeste og laveste verdiene tas ikke med.

I eksempeltabellen har du verdien 0,2 som det andre argumentet. Dette betyr at 20% av de ti overførte verdiene ikke er inkludert i beregningen. Med ti verdier betyr dette: To verdier faller ut av beregningen: den største og den minste verdien. Ved beregning av antallet manglende verdier, runder Excel alltid ned til nærmeste partall, slik at det samme antallet verdier alltid trimmes over og under.

Du vil bidra til utvikling av området, dele siden med vennene dine

wave wave wave wave wave