Анализ на първично статистик

За да определите колко математически и статистическа обработка, първо е необходимо да се направи оценка на характера на разпределението на всички използвани параметри. За параметрите, които имат нормално разпределение или близко до нормалното, то е възможно да се използват методите на параметрични статистически данни, които в много случаи са по-мощни от методи за непараметрични статистически данни. Предимството на последните е, че те позволяват да се провери статистическата хипотеза, независимо от формата на разпределение.







Един от най-важните в математическата статистика е, че на нормално разпределение. Нормално разпределение - различна модел на случайна променлива чиито стойности се определят чрез едновременно задействане на множество независими фактори. Брой на тези фактори е голям, и влиянието на всеки един от тях поотделно е много малък. Този знак на взаимно влияние е много характерно за психични явления, така че изследователят в областта на психологията, често разкрива нормално разпределение. Все пак, това не винаги е така, във всеки случай, формата на разпределението трябва да бъде проверена.

Най-важните първични статистически данни са:

а) средноаритметичната стойност - е стойността на сумата на положителните и отрицателните отклонения от нула. В статистика, тя означена с буквата M или х. , Е необходимо да се изчисли сумата всички стойности на поредицата и да си поделят сумата от броя на обобщени стойности. Ако номерът е, броят със знак "минус", сумиране се извършва като се вземат предвид знаците.

б) стандартно отклонение (означен с гръцката буква S (Sigma), а също и по-нататък главната или стандартно отклонение) - мярка за разнообразие в групата на обекти; показва колко средното отклонява всеки вариант (конкретната стойност на очакваните параметър) от средната аритметична стойност. По-диспергирани вариации по отношение на средната стойност, толкова по-голяма е средно и стандартно отклонение. Стойностите на разсейване характеризира величината - разликата между най-голямата и най-малката стойност в серията. Въпреки сигма напълно характеризира вариант стойности по отношение на средната аритметична стойност.

в) Коефициентът на вариация - отношението на средната аритметична стойност за сигма умножават по 100%. Определени CV:

Sigma - стойност на име и зависи не само от степента на отклонение, но и на единици. Ето защо, Sigma може да се сравни само променливост на едни и същи показатели, а за сравнение на различните характеристики на абсолютната стойност Sigma не може да бъде. За сравнение нивото на променливостта признаци на измерение (изразени в различни единици на измерване) и за да се избегне влиянието на скалата за измерване на средната аритметична стойност на сигма, коефициент на вариация се използва, което е намаляване на по същество същата скала стойност S.







За нормално разпределение са известни точни количествени отношения и честота стойности позволяват да се предскаже появата на нов вариант: 1) отляво и отдясно на средната аритметична стойност е 50% на изпълнение; 2) в обхвата на М-1s до М +1 - 68,7% изпълнение; 3) в диапазона на М-1.96s за М + 1.96s - 95% версия.

По този начин, като се фокусира върху характеристиките на нормално разпределение, е възможно да се направи оценка на степента на близост до разглеждания разпределение.

По-долу са такива първични статистически данни в важност като асиметрия и ексцес. Коефициент на асиметрия - показател за разпределението на асиметрия наляво или надясно по хоризонталната ос. Ако на десния крак е по-дълъг от лявата крива - говорим за положителна асиметрия, в обратния случай - на отрицателно. индекс ексцес достигна. Криви, по-високи в централната му част - са достигнали своя връх, наречен прекомерно, те имат голяма стойност на ексцес. Когато се намали количеството излишна крива става по-плоска, придобиване на плато, а след това на седлото - деформацията на средната част.

Тези опции ви позволяват да се направи първата приблизителна представа за характера на разпределението: нормалното разпределение е рядкост да се открие Коефициент на асиметрия в близост до единство и повече единство (-1 и +1).

Искам да подчертая, че това е само приблизителна оценка. Точна и точна оценка на нормално разпределение може да се получи с помощта на един от съществуващите методи за идентификация (вж. Например глави 2 и 5 книга G.V.Suhodolskogo "Основи на математическата статистика за психолози". ML 1972)

Започнете с анализ на първичните статистически данни е необходимо също така поради причината, че те са много чувствителни към наличието на опция от падащото. Големи количества излишък и асиметрия често индикатор за грешка в изчисленията ръчно или грешка при въвеждането на данни чрез клавиатурата за компютърна обработка. Грешките при въвеждането на данни в обработката могат да бъдат открити чрез сравняване на стойността на сигма имат подобни параметри. освободен стойност сигма може да показва грешка.

Има едно правило, че всички изчисления трябва да се извършват на ръка два пъти (специална отговорност - три пъти), и е желателно по много начини, с вариация на последователността на препратка към цифров масив.

Като част от никога не се проваля за пълна оценка на цялото, винаги има вероятност, че оценката на населението като цяло въз основа на данните на пробата не е достатъчно точна, има някои по-голяма или по-малка грешка. Такива грешки, които представляват екстраполация обобщение грешка, свързана с прехвърлянето на получените резултати в проби от проучването относно цялото население, наречена граница грешка. Представителност - степента, до която общите параметри на индикатори.

Границата на статистическата грешка показват границите, в които параметрите могат да се отклоняват от общата популация (от очакването или действителни стойности) нашата частен определяне получени въз основа на конкретни проби. Очевидно е, че стойността за грешка е по-голяма от промяната на функция и по-голяма от по-малката извадката. Това е отразено във формулите за изчисляване на статистически грешки, които характеризират изменението на избрани показатели по техните общи параметри.

Статистиката включват броя на първичната статистическа грешка на средната аритметична стойност. Формулата за изчисление му е, както следва:

където m - SEM, S - Sigma, п - брой игрални стойности. Това са основните първични статистически данни, които дават усещане за разпределението на данните в експериментален масив.