Det er “fejl på fejl på fejl” Det skriver vildtbiolog Egon Bennetsen efter sin gennemgang af DCE’s anbefalede tandsnitsmetode. En metode som måske skal anvendes som barometer på fremtidens kronvildtforvaltning …
Af: Egon Bennetsen, Vildtbiolog, d. 25.12. 2016
NOTAT VEDRØRENDE DCEs ANALYSE AF TANDSNITSMETODEN
Konklusion:DCE har forsøgt at validere tandsnitsmetoden til aldersbestemmelse på et materiale bestående af 37 danske krondyr. Forskerne på DCE har kaldt det ”guldstandarden” inden for aldersbestemmelse af kronvildt. Metoden er vidt udbredt, og som eksempler nævner DCE kronvildt og elg i Norge. Man hævder, at metoden rammer tæt på den faktiske gennemsnitsalder for en bestand. Det er rigtigt nok, men gennemsnitsalderen er helt uinteressant, når det – sådan som metoden er tiltænkt i den danske hjorteforvaltning – drejer sig om at vurdere, hvorvidt 5 af 100 hjorte (5%) er 8 år eller ældre. DCE har behandlet tandsnitsmetoden. Rapporterne indeholder imidlertid en række faglige fejl både hvad angår teksten, grafikken og tabellerne. Men værst af alt indeholder rapporterne også en række graverende statistiske og faglige fejl i DCEs beregning og vurdering af tandsnitsmetodens præcision. DCE postulerer følgende: 1) Tandsnitsmetoden har en høj grad af forklaret variation (Determinationskoefficienten) R2 = 0,92 = 92% 2) Tandsnitsmetoden kan fastlægge den faktiske alder +/- 2 år 3) Tandsnitsmetoden kan fastlægge den reelle alder +/- 10 % Som dette notat viser, er faktum derimod, at tandsnitsmetoden har en meget lav forklaringsgrad på kun 50 %, og således videnskabelig set er ubrugelig samt at DCE i flere tilfælde fejlagtigt tolker tandsnitsmetodens præcision på en måde, der slet ikke er fagligt belæg for. Med andre ord: Fejl på fejl på fejl. Det er altså ikke på redelig vis lykkedes DCE at validere tandsnitsmetoden på danske krondyr. Hvorvidt det skyldes metodeusikkerhed, eller det skyldes de forhold dyrene lever under i Danmark (eksempelvis lille årstidsvariation i fødegrundlag), aner jeg ikke. Det er derimod sikkert, at aldersbestemmelse vha. tandsnit er uanvendelig for danske krondyr, og at metoden derfor ikke kan danne grundlag for fremtidens kronvildtforvaltning. |
- ****** GENNEMGANG ******
1) Fejl i DCEs analyse af tandsnitsmetodens præcision (R2)
I DCE-rapporten: Bæredygtig kronvildtforvaltning. Videnskabelig rapport nr. 106. 2014 Sunde og Haugaard (Kilde 1)
hævdes det:
”I et referencemateriale på 37 individer med kendt alder (mærket som kalve eller 1-årige), kunne de enkelte dyrs alder uden systematiske fejlkilder og med en høj grad af forklaret variation (R2 = 97 %) estimeres vha.antallet af vækstlinjer i tandmateriale, om end med en usikkerhed på ± 2 år for det enkelte individ. Overordnet set betyder dette, at aldersbestemmelse vha. tandsnit må betegnes som en anvendelig og objektiv metode til aldersbestemmelser af danske krondyr.” (Min fremhævelse).
Referencematerialet er vist i nedenstående fig. 5.
Her er det dog kun muligt at finde de 30 punkter. Der mangler altså 7. Det er en klar fejl.
Jeg beder i en henvendelse til DCE (31/10/16) om en forklaring på to forskellige værdier på R2, nemlig de 97 % nævnt ovenfor, og de 0,919 = 92 %, der er angivet i figur 5.
Hertil svarer Aksel Bo Madsen på vegne af DCE (2/11):
”I din henvendelse kan vi se at R2 – værdien i Figur er forkert angivet til 97 % side 5, og det vil vi ændre til den korrekte værdi 92%. Fejlen beror på en hændelig, beklagelig slåfejl.” Min fremhævelse.
Igen en klar fejl taget i betragtning, at adskillige fagpersoner, heriblandt mindst 6 fra DCE, har gennemlæst og/eller kvalitetssikret rapporten. (http://www.netnatur.dk/dnhs-hjoreteplan-det-faglige-grundlag-d/
I et notat fra DCE til Danmarks Jægerforbund (16/9/16):
ALDERSBEDØMMELSE OG KÆBEINDSAMLING
står der:
”I en analyse af 37 dyr med kendt alder, blev den estimerede alder for det enkelte dyr fra og med det 4. fyldte år undertiden estimeret ente for højt eller for lavt i forhold til dyrets rigtige alder (Sunde and Haugaard 2014: Figur 5). I gennemsnit rammer aldersbestemmelsen imidlertid rigtigt, hvilket betyder at en bestands aldersfordelingen estimeret ud fra denne metode bliver retvisende og med en høj statistisk forklaringsgrad (92-98 %: Figur 5 og 6 i Sunde and Haugaard 2014)” (Min fremhævelse).
På et tidligt tidspunkt forekom det mig, og flere andre, besynderligt, at den viste fordeling af de 30 punkter i figur 5, kunne give en så høj forklaringsgrad (præcision) som de angivne 92 %.
I artiklen på Netnatur.dk d. 2/10: http://www.netnatur.dk/dnhs-hjoreteplan-det-faglige-grundlag-d/
har jeg fremført, at min beregning af R2, på grundlag af de 30 punkter der kunne erkendes, var: 0,42. Hvis de resterende 7 punkter blev placeret på linjen Y= X, var værdien 0,51. Alt beregnet relativt simpelt i Excel.
TØVENDE UDLEVERING
At tabellen, der lå til grund for figur 5, ikke var medtaget i rapporten (Kilde 1), er en grov fejl. Selvom jeg havde påpeget de manglende 7 punkter, var de ikke medsendt i svaret d. 2/11/16. Jeg kunne derfor ikke lave den korrekte beregning i forhold til Peter Sundes beregning på 0,92.
Den 8/11 begærede jeg derfor i henhold til offentlighedsloven aktindsigt i de 7 punkter og beregningen af den mistænkeligt høje forklaringsgrad på 0,92. Først den 23/11 skete der noget, da jeg fik fremsendt de 37 punkter (Bilag 1) og beregningen af R2 (Bilag 2) fra en jurist i DCE.
(Filen med beregningen af regressionen med R2 værdien på 0,92 fylder 17 sider. I Bilag 2 er medtaget de 2 sider, der opsummerer beregningen).
På baggrund heraf kunne jeg beregne R2 til 0,5014 = 0,50 = 50 %. Altså en meget lav forklaringsgrad, der ikke kan anvendes videnskabeligt.
DCE fastholdt altså– ukommenteret – værdien på 0,92.
…………………………………..
Den 7/11/16 blev jeg af Danmarks Jægerforbund inviteret til møde i Jagtens Hus sammen med nogle jagtforeningsformænd fra Thy, der har efterspurgt svar på mine spørgsmål, som de finder relevante.
I indbydelsen stod bl.a.:
”På vegne af Danmarks Jægerforbund vil vi gerne invitere jer til et dialogmøde i Jagtens Hus for at gå i dybden med besvarelse af nogle af de spørgsmål I har stillet knyttet til hjortevildtforvaltning og adaptiv forvaltning.” (Min fremhævelse).
På mødet, der blev afholdt d. 13/12, havde vi håbet, at Peter Sunde og Aksel Bo Madsen, som repræsenterede DCE, ville forklare, hvordan Sunde var kommet frem til de 0,92.
Stor var vores forbløffelse, da Aksel Bo Madsen startede mødet med at fastslå, at man ikke agtede at svare på mine spørgsmål, ud over hvad der allerede var sket med Bilag 1 og Bilag 2.
Vi fik altså ikke en forklaring på – eller en diskussion om – hvorfor vi kunne komme frem til to forskellige grader af præcision for de samme 37 punkters R2 værdi.
Peter Sunde betonede dog, at de havde anvendt statistikprogrammet SAS, og at det blev brugt af mange videnskabelige institutter.
Så med hensyn til hvorvidt tandsnitsmetoden med de 37 danske krondyr med kendt alder er videnskabeligt valideret med resultatet i figur 5, stod vi mildest talt milevidt fra hinanden
Da jeg ikke er statistiker, var det svært at komme videre, når DCE hårdnakket nægtede at medvirke til en afklaring.
Det var der imidlertid et par statistiske begavelser, vi kalder dem NN1 og NN2, der gerne ville…!
DEN TEKNISKE ANALYSE
I bilag 1 fra DCE fik jeg endelig kendskab til de 37 punkter.
Sat ind i Excel giver det følgende fig.:
Figur 1
Bemærk: I figurerne vises kun 28 af de 37 punkter, der ligger til grund for beregningerne, idet flere datapar er identiske. For datasættet med de 37 krondyr se bilag 1.
Heraf fremgår det tydeligvis at R2 = 0.5014
Bemærk at linjen er med skæring i punktet 0,0.
(Hvorvidt dette er korrekt, kan i høj grad diskuteres, hvis linjen skal bruges til kalibrering af fremtidige resultater).
Hvis vi ikke ”tvinger” linjen gennem 0,0, men bruger beregnet skæring, ændres R2 kun ubetydeligt til 0,5182. Se Figur 2
Figur 2
En entusiastisk person gjorde mig opmærksom på, at en af hans kolleger havde vist ham, at man også i Excel, ved hjælp at et tillægsprogram med ”Dataanalyse”, kunne komme frem til 0,92.
Hvis vi her (fejlagtigt) vinkler feltet: ”Konstant er nul” af, får vi Sundes R2 = 0.9189, hvilket er langt fra de ovennævnte = 0,5014
Hvis vi ikke vinkler feltet: ”Konstant er nul” af, får vi R2 = 0,5182. Nøjagtig som vist i fig. 2
…………………………………..
De to statistikkyndige NN1 og NN2, der var grebet af diskussionen, sendte mig uafhængigt af hinanden deres beregninger af R2, der giver mig ret i, at den rette R2 værdi er 0,5014 = 0,50 = 50%.
NN1s bevis (Bilag 3):
Konklusion: ”Jeg kan kun se at R2 bliver 0.5014.”
****
NN2s bevis (Bilag 4):
(Se desuden: Bilag 4A (NN2 forsøg beregnet) og Bilag 4B (NN2 forsøg grafisk).)
Konklusion:
Med skæring i 0
SAK Model 444,32
SAK Residual 221,54
SAK total 665,86
R^2 0,5014
”Jeg er fuldstændig overbevist om at DCE regner forkert i deres SAK (model)”
(Min fremhævelse)
NN2’s påpegning af fejlen I Sundes beregning. (Bilag 5)
Her hedder det bl.a.:
”DCE fjumrer så vidt jeg kan se i Den samlede kvadrerede sum af totale afstande til middelværdi. De måler ikke afstanden fra hvert datapunkt op/ned til middelværdien. De måler i stedet afstanden ned til 0”
****
Det står herefter fuldstændig klart, at Peter Sunde og Aksel Bo Madsen gentagne gange fastholder en helt forkert R2 værdi på 0.92, mens den rigtige værdi er 0,5014 = 0,50.
Efter at have skygget datasættet i Excel, kræver det blot 7 museklik, at få grafen og værdierne i fig. 1 frem!
****
Konklusion angående tandsnitsmetodens præcision (R2):
Der er således aldeles ikke tale om, at de enkelte dyrs alder kan estimeres ” med en høj grad af forklaret variation (R2 = 97%) (Rettet til 0,92), som hævdet af DCE.
Tværtimod kan de enkelte dyrs alder kun estimeres med en meget lav grad af forklaret variation (R2 = 0,50 = 50%)!
Som tandsnitsmetoden er udført og præsenteret af DCE, er den fuldstændig ubrugelig som videnskabelig analysemetode, og tandsnitsmetoden kan slet ikke anvendes til, med nogen acceptabel grad af præcision, at vurdere om 5 ud af 100 dyr (5%) er 8 år eller ældre!
EKSEMPLER
A) Jeg vil nu give et eksempel på hvor mange af de 37 punkter, man er nødt til at fjerne for at opnå en R2 værdi på 92 %:
Figur 3
I det givne eksempel er beregningen foretaget på baggrund af de 30 punkter, der ligger i intervallet: Rigtig alder +/- 2 år. (Blå punkter). (Husk flere af punkterne har identiske datapar (Bilag 1)).
Det betyder altså, at for at få den høje R2 værdi på 0,92 er vi er nødt til at udelade de 7 punkter, (Røde), der ligger 3 år eller mere fra rigtig alder!
B.) Herefter et eksempel, der viser, hvad R2 værdien bliver, hvis vi kun accepterer en afvigelse på +/- 1 år:
I dette eksempel er beregningen foretaget på baggrund af de 27 punkter, der ligger i intervallet: Rigtig alder +/- 1 år. (Blå punkter) (Husk flere af punkterne har identiske datapar (Bilag 1)).
Jeg har hele tiden hævdet, at: Rigtig alder +/- 1 år må anses for at være en acceptabel afvigelse. Det ville med dette datasæt kræve, at R2 værdien skal være over 0,95 = 95 % og bevirke, at vi er nødt til at se bort fra de 10 punkter, der ligger længst væk fra de rigtige værdier.
2) Fejl i DCEs vurdering af tandsnitsmetoden (+/- 2 år)
I DCE-rapporten: Bæredygtig kronvildtforvaltning. Videnskabelig rapport nr. 106. 2014 Sunde og Haugaard (Kilde 1) hævdes det:
”I et referencemateriale på 37 individer med kendt alder (mærket som kalve eller 1-årige), kunne de enkelte dyrs alder uden systematiske fejlkilder og med en høj grad af forklaret variation (R2 = 97 %) estimeres vha. antallet af vækstlinjer i tandmateriale, om end med en usikkerhed på ± 2år for det enkelte individ.” Min fremhævelse.
Der gøres altså i rapporten gældende, at tandsnitsmetoden kan fastlægge den faktiske alder med en usikkerhed på +/- 2 år.
Jeg har spurgt DCE om denne påstand er baseret på DCE-rapportens fig. 5?
DCE har nægtet at svare på mit spørgsmål.
DCEs påstand er imidlertid helt forkert. På figur 5 og bilag 1 ses nemt, at følgende 7 punkter (Røde punkter i figur 3) ikke lever op til påstanden:
X-værdi | Y-værdi |
5 | 14 |
5 | 2 |
7 | 15 |
8 | 5 |
8 | 11 |
12 | 8 |
14 | 11 |
Dette er en grov fejl, idet DCE derved får tandsnitsmetoden til at fremstå med en nøjagtighed, der ikke er belæg for.
3) Fejl i DCEs vurdering af tandsnitsmetoden (+/- 10 %)
I: Modeller for måling af udviklingen i andelen af ældre hjorte i danske krondyrbestande. Notat fra DCE – Nationalt Center for Miljø og Energi Dato: 13. maj 2016, Peter Sunde
hævdes det:
”Aldersbestemmelse vha. tandsnit må betragtes som den mest præcise og eksakte aldersbestemmelsesmetode (+/- 10 % af reel alder) (Sunde & Haugaard 2014))” Min fremhævelse
Igen har jeg spurgt DCE om denne påstand er baseret på DCE-rapportens fig. 5?
DCE har også nægtet at svare på dette spørgsmål.
Sunde gør altså gældende, at tandsnitsmetoden kan fastlægge den faktiske alder med +/- 10%.
I henhold til de almindelige afrundingsregler indebærer det, at dyr der er i aldersintervallet 1 – 4 år (4 år +/- 10 % = 3,6 – 4,4 år) ikke må afvige fra kendt alder. I aldersintervallet 5 – 14 år må dyrene afvige med +/- 1 år fra kendt alder. (5 år +/- 10 % = 4,5 – 5,5 år og 14 år +/- 10 %= 12,6 – 15,4 år).
Af bilag 1 ses det nemt, at hele 14 af 37 punkter ikke lever op til påstanden.
Dette er en grov fejl, idet DCE derved får tandsnitsmetoden til at fremstå med en nøjagtighed, der slet ikke er belæg for.
Bilag
Bilag 1
ID | population | snit_est | FACIT | sex | ID_NINA |
2010A7 | Oksbøl | 2 | 2 | M | A7 |
2012A16 | Jægersborg | 3 | 3 | M | A16 |
2010A10 | Oksbøl | 3 | 4 | F | A10 |
2010A12 | Oksbøl | 3 | 4 | F | A12 |
2010A15 | Oksbøl | . | 4 | M | A15 |
2010A18 | Oksbøl | 5 | 4 | F | A18 |
2010A5 | Oksbøl | 3 | 4 | M | A5 |
2010A13 | Oksbøl | 14 | 5 | F | A13 |
2010A16 | Oksbøl | 5 | 5 | F | A16 |
2010A4 | Oksbøl | 4 | 5 | F | A4 |
2010A9 | Oksbøl | 2 | 5 | F | A9 |
2012A15 | Jægersborg | 5 | 6 | M | A15 |
2010A14 | Oksbøl | 15 | 7 | F | A14 |
2010A3 | Oksbøl | 6 | 7 | M | A3 |
2011A2 | St. Frederikslund Dyrehave | 6 | 7 | M | A2 |
2011A4 | St. Frederikslund Dyrehave | 7 | 7 | M | A4 |
2010A1 | Oksbøl | 9 | 8 | F | A1 |
2010A11 | Oksbøl | 10 | 8 | F | A11 |
2010A17 | Oksbøl | 8 | 8 | F | A17 |
2010A2 | Oksbøl | 5 | 8 | M | A2 |
2010A6 | Oksbøl | 11 | 8 | F | A6 |
2010A8 | Oksbøl | 8 | 8 | F | A8 |
2011A3 | St. Frederikslund Dyrehave | 6 | 8 | M | A3 |
2012A1 | Jægersborg | 9 | 8 | M | A1 |
2012A10 | Jægersborg | 8 | 8 | M | A10 |
2012A14 | Jægersborg | 8 | 8 | M | A14 |
2011A1 | St. Frederikslund Dyrehave | 8 | 9 | M | A1 |
2012A7 | Jægersborg | 10 | 10 | M | A7 |
2012A9 | Jægersborg | 8 | 10 | M | A9 |
2012A11 | Jægersborg | 11 | 11 | M | A11 |
2012A13 | Jægersborg | 11 | 11 | M | A13 |
2012A6 | Jægersborg | 10 | 11 | M | A6 |
2012A12 | Jægersborg | 12 | 12 | M | A12 |
2012A2 | Jægersborg | 12 | 12 | M | A2 |
2012A3 | Jægersborg | 13 | 12 | M | A3 |
2012A8 | Jægersborg | 8 | 12 | M | A8 |
2012A4 | Jægersborg | 12 | 13 | M | A4 |
2012A5 | Jægersborg | 11 | 14 | M | A5 |
Bilag 2
Linear Regression Results
The REG Procedure
Model: Linear_Regression_Model
Dependent Variable: snit_est
Number of Observations Read | 38 |
Number of Observations Used | 37 |
Number of Observations with Missing Values | 1 |
Note: No intercept in model. R-Square is redefined.
Analysis of Variance | |||||
Source | DF | Sum of Squares |
Mean Square |
F Value | Pr > F |
Model | 1 | 2511.45938 | 2511.45938 | 408.11 | <.0001 |
Error | 36 | 221.54062 | 6.15391 | ||
Uncorrected Total | 37 | 2733.00000 |
Root MSE | 2.48071 | R-Square | 0.9189 |
Dependent Mean | 7.86486 | Adj R-Sq | 0.9167 |
Coeff Var | 31.54163 |
Parameter Estimates | |||||
Variable | DF | Parameter Estimate |
Standard Error |
t Value | Pr > |t| |
FACIT | 1 | 0.97646 | 0.04834 | 20.20 | <.0001 |
Bilag 3
Jeg har lavet et lille script i Matlab UDEN brug at funktioner, dvs. man kan regne alt ud på et stykke papir, hvis man har lyst J Nedenfor kan i se koden og resultaterne. Jeg kan kun se at R^2 bliver 0.5014.
Universitetet bør kunne lave en tilsvarende beregning UDEN brug at statistik-værktøjer…der er trods alt ikke mange data at arbejde med.
% colums: Known, Estimated
rawData=[2 2
3 3
4 3
4 3
4 5
4 3
5 14
5 5
5 4
5 2
6 5
7 15
7 6
7 6
7 7
8 9
8 10
8 8
8 5
8 11
8 8
8 6
8 9
8 8
8 8
9 8
10 10
10 8
11 11
11 11
11 10
12 12
12 12
12 13
12 8
13 12
14 11]
% Define variables
x = rawData(:,1); % Known Age
y = rawData(:,2); % Estimated Age
%========================================================================
% Least Square Fit to model: y = ax
%========================================================================
a = (x’*x)^-1*x’*y % Matrix form of Least Square (x’ = transpose)
% Calculate age based on fitted model y=ax
yCalc = a*x;
%========================================================================
%Calculate R^2 DIRECTLY:
%========================================================================
Rsq1 = 1 – sum((y – yCalc).^2)/sum((y – mean(y)).^2)
%========================================================================
%STEP-BY-STEP calculation of R^2:
%========================================================================
% Compute the residual values as a vector of signed numbers:
yresid = y – yCalc;
% Square the residuals and total them to obtain the residual sum of squares:
SSresid = sum(yresid.^2)
% Compute the total sum of squares of y by multiplying the variance of y by the number of observations minus 1:
SStotal = (length(y)-1) * var(y)
%Compute R2 using the formula given in the introduction of this topic:
Rsq2 = 1 – SSresid/SStotal
RESULTATER
a =
0.9765
Rsq1 =
0.5014
SSresid =
221.5406
SStotal =
444.3243
Rsq2 =
0.5014
Bilag 4:
Hvis du lige bruger eksemplet med cykler fra i går, så prøv at sætte den i relation til figuren herunder.
x-aksen er salg af cykler fra en cykelhandler
y-aksen er salg af cykelhjelme fra samme cykelhandler
(Vi forventer at der er en lineær sammenhæng. )
I 1995 sælges 1000 cykler og 300 cykelhjelme
I 1996 sælges der 2000 cykler og 700 hjelme. (altså 400 end året før mere. Antallet af cykler er fordoblet, men antallet af hjelme er MERE end fordoblet)
De første 300 ekstra hjelme som er solgt i 1996 kan umidelbart forklares ved at at antalet af solgte cykler er fordoblet.
De sidste 100 kan ikke umidelbart forklares modellen og må skyldes ”noget andet” (måske en trafiksikkerhedskampagne)
SAK står for Sum Af Kvadrater
Total= 400
Model = 300
Residual = 100
Når du har forstået grafen og er med på begreberne Model, Total og Residual, så kan vi gå videre til afsnittet herunder.
Excel Grafisk med skæring i 0
Hældning: 0,9765x
Skæring: 0
R^2: 0,5014
Excel grafisk med ”bedste rette linie” og dermed ikke skæring i 0
Hældning: 0,8358
Skæring: 1,2687
R^2: 0,5182 (altså en anelse højere R^2 end hvis man tvinger linien igennem 0 på y aksen)
Alt dette er er kendt viden. Det har vi hele tiden vidst.
Dataene nedenfor kommer fra vedhæftede ark (X forsøg beregnet)
Med skæring i 0
SAK Model 444,32
SAK Residual 221,54
SAK total 665,86
R^2 0,5014
Uden skæring i 0
SAK Model 444,32
SAK Residual 214,09
SAK total 658,41
R^2 0,5182
Bemærk at summen af både resudialer og SAK total falder når vi benytter den bedste rette linie overhovedet.
R^2 beregnes i øvrigt ovenfor vha følgende formel:
Både DCE og jeg beregner summen af residualer til 221,54
Jeg beregner dog Sum Of Squares –MODEL til 444,32. Den får DCE til 2511,45!!!!!!.
Formelen til SAK-model er ellers ret simpel, så tallet herunder kan hurtigt forkastes som noget værre volapyk
Tallet 2511,45 bruger DCE så videre i deres beregning til F-teststørrelsen, som er beregnet som vist nedenfor.
Jeg har indsat tal for at hjælpe dig lidt på vej
Hvis vi bruger min beregning får vi en helt anden teststørrelse
Man kan tage gennemsnitshøjden af 30 mennesker på Borneo og gennemsnitshøjden for 30 danskere. Lad os sige at det er henholdsvis 1,68 og 1,78.
Det betyder jo ikke at vi med 100% sikkerhed kan sige at gennemsnitshøjden på ALLE mennesker på Borneo er forskellig fra gennemsnitshøjden på ALLE danskere.
Middelværdierne i stikprøverne er uomtvisteligt forskellige, men det kunne jo være at vi havde valgt 30 lave Borneanere og 30 høje danskere ved rent uheld.
Derfor laver man altid en F-test for at vurdere sandsynligheden af at man tager fejl i sin hypotesetest
Hypoteseteste i eksemplet her er: H0 = Gennemsnitshøjden for folk på Borneo og gennemsnitshøjden for Danskere er ens
Hvis man forkaster 0-hypotesen, er det samtidig god skik at skrive sandsynligheden for at man har begået en fejl. Den kunne f.eks. være 0,1%
Beregningen af sandsynligheden for at man tager fejl fremkommer når man laver en sandsynlighedsberegning på F-kritisk > F-test. ( Også kaldet Pr > F)
F-kritisk kan man slå op i nogle tabeller. Det er nogle standardværdier som afhænger af konfidensinterval (f.eks. 95% sikkerhed) og antallet af frihedsgrader i stikprøven.
Vi skal lige grave lidt mere i det her, men husk på at ANOVA anlysen er en analyse hvor vi sammenligner varianser to to grupper for at afgøre om man med rimelig sandsynlighed kan sige at middelværdierne er ens.
Jeg er fuldstændig overbevist om at DCE regner forkert i deres SAK (model)
Denne beregning fører de så videre til beregning af F-test.
Det medfører at deres Pr > F (PR står for Probability) er forkert.
De forkaster IKKE nulhypotesen og konkluderer at de to middelværdier i tandsnitsmetode og faktisk alder er identisk.
De siger også at sandsynligheden for at ovenstående sætning er løgn og latin er under 0,0001
Beregningen af 0,0001 er dog fremkommet på forkert grundlag, da deres F-model jo er beregnet forkert.
Det betyder ikke nødvendigvis at konklusionen i rapporten er forkert.
Den kan stadig godt være rigtig, men deres matematik er forkert.
F-model er forkert og PR > F er forkert. Basta!
Bilag 4A
Med skæring i 0 | Uden skæring i 0 | ||||||||
snit_est | FACIT | SAK model | Udregnet alder | SAK Residual | SAK total | SAK model | Udregnet alder | SAK Residual | SAK total |
2 | 2 | 34,39663988 | 1,953 | 0,002209 | 34,39884888 | 34,3966399 | 2,9403 | 0,88416409 | 35,280804 |
3 | 3 | 23,66691015 | 2,9295 | 0,00497025 | 23,6718804 | 23,6669102 | 3,7761 | 0,60233121 | 24,2692414 |
3 | 4 | 23,66691015 | 3,906 | 0,820836 | 24,48774615 | 23,6669102 | 4,6119 | 2,59822161 | 26,2651318 |
3 | 4 | 23,66691015 | 3,906 | 0,820836 | 24,48774615 | 23,6669102 | 4,6119 | 2,59822161 | 26,2651318 |
5 | 4 | 8,207450694 | 3,906 | 1,196836 | 9,404286694 | 8,20745069 | 4,6119 | 0,15062161 | 8,3580723 |
3 | 4 | 23,66691015 | 3,906 | 0,820836 | 24,48774615 | 23,6669102 | 4,6119 | 2,59822161 | 26,2651318 |
14 | 5 | 37,63988313 | 4,8825 | 83,1288063 | 120,7686894 | 37,6398831 | 5,4477 | 73,1418353 | 110,781718 |
5 | 5 | 8,207450694 | 4,8825 | 0,01380625 | 8,221256944 | 8,20745069 | 5,4477 | 0,20043529 | 8,40788598 |
4 | 5 | 14,93718042 | 4,8825 | 0,77880625 | 15,71598667 | 14,9371804 | 5,4477 | 2,09583529 | 17,0330157 |
2 | 5 | 34,39663988 | 4,8825 | 8,30880625 | 42,70544613 | 34,3966399 | 5,4477 | 11,8866353 | 46,2832752 |
5 | 6 | 8,207450694 | 5,859 | 0,737881 | 8,945331694 | 8,20745069 | 6,2835 | 1,64737225 | 9,85482294 |
15 | 7 | 50,9101534 | 6,8355 | 66,6590603 | 117,5692136 | 50,9101534 | 7,1193 | 62,1054325 | 113,015586 |
6 | 7 | 3,477720964 | 6,8355 | 0,69806025 | 4,175781214 | 3,47772096 | 7,1193 | 1,25283249 | 4,73055345 |
6 | 7 | 3,477720964 | 6,8355 | 0,69806025 | 4,175781214 | 3,47772096 | 7,1193 | 1,25283249 | 4,73055345 |
7 | 7 | 0,747991234 | 6,8355 | 0,02706025 | 0,775051484 | 0,74799123 | 7,1193 | 0,01423249 | 0,76222372 |
9 | 8 | 1,288531775 | 7,812 | 1,411344 | 2,699875775 | 1,28853178 | 7,9551 | 1,09181601 | 2,38034779 |
10 | 8 | 4,558802045 | 7,812 | 4,787344 | 9,346146045 | 4,55880205 | 7,9551 | 4,18161601 | 8,74041806 |
8 | 8 | 0,018261505 | 7,812 | 0,035344 | 0,053605505 | 0,0182615 | 7,9551 | 0,00201601 | 0,02027751 |
5 | 8 | 8,207450694 | 7,812 | 7,907344 | 16,11479469 | 8,20745069 | 7,9551 | 8,73261601 | 16,9400667 |
11 | 8 | 9,829072316 | 7,812 | 10,163344 | 19,99241632 | 9,82907232 | 7,9551 | 9,27141601 | 19,1004883 |
8 | 8 | 0,018261505 | 7,812 | 0,035344 | 0,053605505 | 0,0182615 | 7,9551 | 0,00201601 | 0,02027751 |
6 | 8 | 3,477720964 | 7,812 | 3,283344 | 6,761064964 | 3,47772096 | 7,9551 | 3,82241601 | 7,30013697 |
9 | 8 | 1,288531775 | 7,812 | 1,411344 | 2,699875775 | 1,28853178 | 7,9551 | 1,09181601 | 2,38034779 |
8 | 8 | 0,018261505 | 7,812 | 0,035344 | 0,053605505 | 0,0182615 | 7,9551 | 0,00201601 | 0,02027751 |
8 | 8 | 0,018261505 | 7,812 | 0,035344 | 0,053605505 | 0,0182615 | 7,9551 | 0,00201601 | 0,02027751 |
8 | 9 | 0,018261505 | 8,7885 | 0,62173225 | 0,639993755 | 0,0182615 | 8,7909 | 0,62552281 | 0,64378431 |
10 | 10 | 4,558802045 | 9,765 | 0,055225 | 4,614027045 | 4,55880205 | 9,6267 | 0,13935289 | 4,69815494 |
8 | 10 | 0,018261505 | 9,765 | 3,115225 | 3,133486505 | 0,0182615 | 9,6267 | 2,64615289 | 2,66441439 |
11 | 11 | 9,829072316 | 10,7415 | 0,06682225 | 9,895894566 | 9,82907232 | 10,4625 | 0,28890625 | 10,1179786 |
11 | 11 | 9,829072316 | 10,7415 | 0,06682225 | 9,895894566 | 9,82907232 | 10,4625 | 0,28890625 | 10,1179786 |
10 | 11 | 4,558802045 | 10,7415 | 0,54982225 | 5,108624295 | 4,55880205 | 10,4625 | 0,21390625 | 4,7727083 |
12 | 12 | 17,09934259 | 11,718 | 0,079524 | 17,17886659 | 17,0993426 | 11,2983 | 0,49238289 | 17,5917255 |
12 | 12 | 17,09934259 | 11,718 | 0,079524 | 17,17886659 | 17,0993426 | 11,2983 | 0,49238289 | 17,5917255 |
13 | 12 | 26,36961286 | 11,718 | 1,643524 | 28,01313686 | 26,3696129 | 11,2983 | 2,89578289 | 29,2653957 |
8 | 12 | 0,018261505 | 11,718 | 13,823524 | 13,8417855 | 0,0182615 | 11,2983 | 10,8787829 | 10,8970444 |
12 | 13 | 17,09934259 | 12,6945 | 0,48233025 | 17,58167284 | 17,0993426 | 12,1341 | 0,01798281 | 17,1173254 |
11 | 14 | 9,829072316 | 13,671 | 7,134241 | 16,96331332 | 9,82907232 | 12,9699 | 3,88050601 | 13,7095783 |
444,3243243 | 221,540627 | 665,8649508 | 444,324324 | 214,089553 | 658,413877 | ||||
0,501398833 | 0,51816828 |
Skæring i 0 | Skæring IKKE i 0 | ||||||||
Gennemsnit | 7,86486486 | Gennemsnit | 7,86486486 | ||||||
Hældning | 0,9765 | Hældning | 0,8358 | ||||||
b | 1,2687 |
Bilag 4B
snit_est | FACIT | ||||||
2 | 2 | ||||||
3 | 3 | ||||||
3 | 4 | ||||||
3 | 4 | ||||||
5 | 4 | ||||||
3 | 4 | ||||||
14 | 5 | ||||||
5 | 5 | ||||||
4 | 5 | ||||||
2 | 5 | ||||||
5 | 6 | ||||||
15 | 7 | ||||||
6 | 7 | ||||||
6 | 7 | ||||||
7 | 7 |
|
|||||
9 | 8 | ||||||
10 | 8 | ||||||
8 | 8 | ||||||
5 | 8 | ||||||
11 | 8 | ||||||
8 | 8 | ||||||
6 | 8 | ||||||
9 | 8 | ||||||
8 | 8 | ||||||
8 | 8 | ||||||
8 | 9 | ||||||
10 | 10 | ||||||
8 | 10 | ||||||
11 | 11 | ||||||
11 | 11 | ||||||
10 | 11 | ||||||
12 | 12 | ||||||
12 | 12 | ||||||
13 | 12 | ||||||
8 | 12 | ||||||
12 | 13 | ||||||
11 | 14 |
Bilag 5
Herunder er et uhyre simpelt plot.
3 punkter
Formel fremgår af grafen
R^2 er defineret som: 1 – (SAKresidual / SAKtotal)
Residual for første datapunkt: (afstand fra punktet op til tendenslinien) = 0,5 (0,5 x 0,5 = 0,25)
Residual for andet datapunkt = – 1 (-1 x -1 = 1)
Residual for tredie datapunkt = 0,5 (0,5 x 0,5 = 0,25)
Den samlede kvadrerede sum af residualer er derfor 0,25 + 1 + 0,25 = 1,5
Gennemsnittet af de 3 datapunkter er (1 + 3 + 2) / 3 = 2
Afstand fra første datapunkt til middelværdi (2 – 1) = 1 (1 x 1 = 1)
Afstand fra andet datapunkt til middelværdi (2 – 3) = – 1 (-1 x -1 = 1)
Afstand fra tredie datapunkt til middelværdi (2 – 2) = 0
Den samlede kvadrerede sum af totale afstande til middelværdi: 1 + 1 = 2
R^2 = 1 – (1,5 / 2) = 1 – 0,75 = 0,25 (som Excel også har fundet frem til)
DCE fjumrer så vidt jeg kan se i Den samlede kvadrerede sum af totale afstande til middelværdi.
De måler ikke afstanden fra hvert datapunkt op/ned til middelværdien. De måler i stedet afstanden ned til 0.
Når de måler afstanden ned til 0 uden hensyntagen til middelværdien i datasættet, vil deres samlede kvadrerede sum af totale afstande til middelværdi blive enorm høj.
Dermed bliver brøken (SAKresidual / SAKtotal) enormt lille (da nævneren i brøken er meget stor. )
Når så formelen giver at R^2 = 1 – SAKresidual / SAKtotal), vil R^2 naturligvis være skyhøj, da bidraget fra brøken (som skal trækkes fra 1) er forsvindende lille)