Først og fremst er det mange, mange forskjellige typer simuleringer i statistikk, og enda mer i de omkringliggende feltene. Bare det å si "Simulering" er omtrent like nyttig som å si "Modell" - det vil si ikke mye i det hele tatt.
Basert på resten av spørsmålet ditt, vil jeg gjette at du mener Monte Carlo simulering, men selv det er litt vagt. I utgangspunktet er det som skjer at du gjentatte ganger trekker prøver fra a distribusjon (det trenger ikke være normalt) for å gjøre noen statistiske analyser av en kunstig populasjon med kjente, men tilfeldige egenskaper.
Formålet med dette har en tendens til å falle i to kategorier:
Kan metoden min håndtere X? : I hovedsak simulerer du en serie med mange tilfeldige populasjoner med en kjent " riktig "svar for å se om den nye teknikken din gir deg tilbake det riktige svaret. La oss si at du har utviklet det du synes er en ny måte å måle sammenhengen mellom to variabler, X og Y, som et grunnleggende eksempel. Du vil simulere to variabler der verdien av Y er avhengig av verdien av X, sammen med noe tilfeldig støy. For eksempel, Y = 0,25x + støy. Deretter oppretter du en populasjon med noen tilfeldige verdier på X, noen verdier på Y som var 0,25x + et tilfeldig tall, sannsynligvis mange tusen ganger, og viser deretter at den nye teknikken din i gjennomsnitt spytter ut et tall som viser riktig at Y = 0,25x.
Hva skjer hvis? Simulering kan gjøres som en sensitivitetsanalyse for en eksisterende studie. La oss si for eksempel at jeg har kjørt en kohortstudie, men jeg vet at eksponeringsmålingen min ikke er veldig bra. Det klassifiserer 30% av fagene mine feil som utsatt når de ikke burde være, og klassifiserer 10% av fagene mine som ueksponerte når de ikke burde være. Problemet er at jeg ikke har en bedre test, så jeg vet ikke hvilken som er hvilken.
Jeg tar befolkningen min og gir hvert utsatt motiv 30% sjanse for å bytte til ueksponert, og hvert ueksponert emne 10% sjanse for å bytte til eksponert. Jeg vil da lage tusenvis av nye populasjoner, som tilfeldig bestemmer hvilke fag som bytter, og kjører analysen på nytt. Omfanget av disse resultatene vil gi meg et godt estimat av hvor mye studieresultatet mitt kan endre seg hvis jeg kunne ha klassifisert alle riktig.
Det er selvfølgelig som alltid større kompleksitet, nyanse og nytte for simulering , avhengig av hvor mye du vil grave.