SlideShare a Scribd company logo
1 of 19
Тема ІІІ Честотни разпределения и корелации
Интервална скала (Scale) Когато стойностите са числа в интервален ред   или в рацио-скала. Променливите трябва да са числа. Това е скала, при която разликите между стойностите може да бъдат изразени количествено в абсолютни стойности, но нулевата точка е фиксирана условно. Известни примери са термометрите (Целзий, Фаренхайт) и календарът. В интервалните скали равните различия между стойностите кореспондират с равни/еднакви различия в измервания признак...
Рацио-скала Скала, при която разликите между стойностите може да бъдат изразени количествено и е ясно определена нулевата точка/стойност, както като се измерва дължина в сантиметри или възраст в години. В рацио-скалата равните различия между стойностите кореспондират с равни различия в измервания признак, а нулевата стойност представлява тотална липса на атрибута.
Абсолютна скала Рацио-скала, при която мерната единица е фиксирана. Такава, например, е температурната скала на Келвин. Логаритмична интервална скала Скала, при която се отчитат съотношения/пропорции,например км/ч
Ординална скала Стойностите са категории с присъщ им ред/отношение между тях (например: „нисък-среден-висок”, „напълно съгласен-съгласен-несъгласен-напълно несъгласен”), без да има стандартна мярка за „стъпката” в разликата между тях. Ординалните променливи може да бъдат или със словесни, или с цифрови стойности, които представляват отделни категории (напр. 1=ниско, 2=средно, 3=високо).
Номинална скала Данните са различни, но нямат свойствен им ред или съподчиненост, например: пол, професия. Номиналните променливи може да бъдат или словесни, или цифрови, които представляват отделни категории, напр.: 1=мъж, 2=жена.  В номиналната скала числата/цифрите са само имена на категориите и нищо повече!
По същия начин въвеждаме всички променливи, като внимаваме как ще записваме данните – като цифри или като думи, както и за начина на скалиране – интервално, ординално или номинално. Таблицата позволява надписването на променливите  ( Label ) , даването на имена на отговорите  ( Values ) , определяне броя на десетичните знаци след нулата и т.н. Когато приключим с въвеждането на променливите, преминаваме към Data   View. Въвеждаме данните...
Следващата стъпка е пресмятането на някои статистики. Честотно разпределение (колко често нещо се среща): Analyze    Descriptive Statistics     Frequencies    избираме променливи     Chart    Histogram    Continue  
За всяка променлива се появяват две таблици в нов екран,  SPSS Viewer . В първата таблица са дадени средните величини ( Mean ) и стандартното отклонение ( Std .  Deviation ). Във втората таблица, първата  колона, са дадени стойностите  на използваната от въпроса скала,  а във втората – съоветното число  респонденти, избрали  този отговор  ( Frequency ) . Накрая са хистограмите, които дават  нагледна представа за броя на респондентите,  които са дали съответния отговор по скалата.
Така получените резултати позволяват да се направят заключения за средните стойности на изследваните категории, за разсейването на отговорите, за разпределението на честотите по съответните степени на скалите.  Това е основа за направата на задължителните съдържателни анализи и изводи, относно изследваните категории.
Средна стойност Аритметичната средна стойност – общата сума, разделена на броя отчетени случаи (изследвани/анкетирани лица); Стандартно отклонение Стандартното отклонение е мярка на вариацията или разпръскването на данни, или също така мярка за вероятностното им разпределение. Ниско стандартно отклонение означава, че данните, или точките които го описват на графика, се групират много близо до една и съща стойност (средна стойност), докато голямо стандартно отклонение предполага, че данните са разположени върху голям набор от стойности.
Например... Ако средната височина за възрастните мъже е 178 см, като стандартно отклонение е 8 см, това означава, че повечето мъже (около 68%, ако се предположи нормално разпределение) имат височина в диапазон до 8 см от средната (т.е. в интервала 170-186 см), докато почти всички мъже (около 95%) имат височина в рамките на 15 см от средната (163-193 см). Ако стандартното отклонение е нулево, тогава височината на всички хора ще бъде точно 178 см. Ако стандартното отклонение е 51 см, това означава че населението ще има много по-различни височини, разпределени в диапазона от около 127 до 229 см.
Медиана Стойността, над и под която половината от случаите попадат, 50-ият персентил. Ако е четен брой случаи, медианата е средната стойност от двата средни случая, когато са подредени по увеличаваща се или намаляваща стойност. Медианата е мярка на централната тенденция, която не е толкова чувствителна към крайните стойности (най-ниската и най-високата), за разлика от средната стойност, която може да бъде повлияна от няколко прекалено високи или прекалено ниски стойности.  Мода Модата приема числовата стойност на онова значение на признака, което се наблюдава с най-голяма честота (при най-много единици от изучаваната съвкупност), с други думи – какво е „модерно” в изследваните случаи (извадката) – кое се среща най-често...
Друг източник на подобно съдържателно обсъждане на статистическата обработка са корелационните зависимости. Между ефекторните въпроси и детерминантите (напр. да се прецени дали постоянната величина, напр. „мъж” може да влияе на променливата, например „удовлетвореност от работата”) може да съществува зависимост, която се проверява с помощта на корелационни коефициенти. Изборът става задължително в зависимост от скалите, с които се работи. Корелационните коефициенти се изчисляват по следния алгоритъм:
Analyze      Descriptive   Statistics      Crosstabs (избираме изчисляването  на двумерни разпределения)      избираме имената на променливите,  смятани за ефекторни    преместваме  променливите в първия прозорец  с надпис Rows      имена на  променливи (избираме по  същия начин имената  на променливите, считани за  детерминанти)      преместваме  променливите във втория прозорец  с надпис Columns      Statistics      Chi - square      Continue      OK
Хи-квадрат Хи-квадрат-анализът служи за проверка на статистически хипотези относно това дали съществува връзка между две качествени променливи, например: между пола и оценката на студентите на равнището на обучение във ВУЗ.
В зависимост от скалите на отделните айтеми, с кликване на мишката върху радио-бутоните избираме подходящи коефициенти на корелация. Те са групирани в 3 карета: номинални скали и за 2-е променливи, рангови и номинална по интервална. Анализът за грешка За да може хи-квадрат да посочва наличие на корелационна връзка, трябва да бъде по-малък от 0,05 или 0,01 – 5 или 1 процент риск за грешка.
Ако това равнище е постигнато, се оценява и величината на корелационния коефициент. Неговата абсолютна стойност е мярка за силата на корелацията: 0,000 – 0,333 – ниска по сила корелация 0,333 – 0,666 – седна по сила корелация 0,666 – 1,000 – висока по сила корелация Знакът „+” означава паралелно изменение на двете променливи: с нарастването на едната – нараства и другата, знакът „-” означава противоположното изменение: с нарастването стойността на причината (увеличаването на възрастта, напр., намалява удовлетвореността от работата) – намалява стойността на следствието, или с намаляването стойността на следствието – нараства стойността на причината (напр. с намаляването на свободното време, нараства неудовлетвореността от секса).
Ако според вида на скалите се нуждаем от други корелационни коефициенти, те може да бъдат използвани и в друга обработка: Analyze    Correlate    Bivariate Коефициентите са следните: Пиърсън  – за интервални скали; Тау Б на Кендъл  – за ординални скали; Спи(ъ)рман  – за рангови редици...

More Related Content

Featured

PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...DevGAMM Conference
 

Featured (20)

Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 

Presentation3

  • 1. Тема ІІІ Честотни разпределения и корелации
  • 2. Интервална скала (Scale) Когато стойностите са числа в интервален ред или в рацио-скала. Променливите трябва да са числа. Това е скала, при която разликите между стойностите може да бъдат изразени количествено в абсолютни стойности, но нулевата точка е фиксирана условно. Известни примери са термометрите (Целзий, Фаренхайт) и календарът. В интервалните скали равните различия между стойностите кореспондират с равни/еднакви различия в измервания признак...
  • 3. Рацио-скала Скала, при която разликите между стойностите може да бъдат изразени количествено и е ясно определена нулевата точка/стойност, както като се измерва дължина в сантиметри или възраст в години. В рацио-скалата равните различия между стойностите кореспондират с равни различия в измервания признак, а нулевата стойност представлява тотална липса на атрибута.
  • 4. Абсолютна скала Рацио-скала, при която мерната единица е фиксирана. Такава, например, е температурната скала на Келвин. Логаритмична интервална скала Скала, при която се отчитат съотношения/пропорции,например км/ч
  • 5. Ординална скала Стойностите са категории с присъщ им ред/отношение между тях (например: „нисък-среден-висок”, „напълно съгласен-съгласен-несъгласен-напълно несъгласен”), без да има стандартна мярка за „стъпката” в разликата между тях. Ординалните променливи може да бъдат или със словесни, или с цифрови стойности, които представляват отделни категории (напр. 1=ниско, 2=средно, 3=високо).
  • 6. Номинална скала Данните са различни, но нямат свойствен им ред или съподчиненост, например: пол, професия. Номиналните променливи може да бъдат или словесни, или цифрови, които представляват отделни категории, напр.: 1=мъж, 2=жена. В номиналната скала числата/цифрите са само имена на категориите и нищо повече!
  • 7. По същия начин въвеждаме всички променливи, като внимаваме как ще записваме данните – като цифри или като думи, както и за начина на скалиране – интервално, ординално или номинално. Таблицата позволява надписването на променливите ( Label ) , даването на имена на отговорите ( Values ) , определяне броя на десетичните знаци след нулата и т.н. Когато приключим с въвеждането на променливите, преминаваме към Data View. Въвеждаме данните...
  • 8. Следващата стъпка е пресмятането на някои статистики. Честотно разпределение (колко често нещо се среща): Analyze  Descriptive Statistics  Frequencies  избираме променливи  Chart  Histogram  Continue 
  • 9. За всяка променлива се появяват две таблици в нов екран, SPSS Viewer . В първата таблица са дадени средните величини ( Mean ) и стандартното отклонение ( Std . Deviation ). Във втората таблица, първата колона, са дадени стойностите на използваната от въпроса скала, а във втората – съоветното число респонденти, избрали този отговор ( Frequency ) . Накрая са хистограмите, които дават нагледна представа за броя на респондентите, които са дали съответния отговор по скалата.
  • 10. Така получените резултати позволяват да се направят заключения за средните стойности на изследваните категории, за разсейването на отговорите, за разпределението на честотите по съответните степени на скалите. Това е основа за направата на задължителните съдържателни анализи и изводи, относно изследваните категории.
  • 11. Средна стойност Аритметичната средна стойност – общата сума, разделена на броя отчетени случаи (изследвани/анкетирани лица); Стандартно отклонение Стандартното отклонение е мярка на вариацията или разпръскването на данни, или също така мярка за вероятностното им разпределение. Ниско стандартно отклонение означава, че данните, или точките които го описват на графика, се групират много близо до една и съща стойност (средна стойност), докато голямо стандартно отклонение предполага, че данните са разположени върху голям набор от стойности.
  • 12. Например... Ако средната височина за възрастните мъже е 178 см, като стандартно отклонение е 8 см, това означава, че повечето мъже (около 68%, ако се предположи нормално разпределение) имат височина в диапазон до 8 см от средната (т.е. в интервала 170-186 см), докато почти всички мъже (около 95%) имат височина в рамките на 15 см от средната (163-193 см). Ако стандартното отклонение е нулево, тогава височината на всички хора ще бъде точно 178 см. Ако стандартното отклонение е 51 см, това означава че населението ще има много по-различни височини, разпределени в диапазона от около 127 до 229 см.
  • 13. Медиана Стойността, над и под която половината от случаите попадат, 50-ият персентил. Ако е четен брой случаи, медианата е средната стойност от двата средни случая, когато са подредени по увеличаваща се или намаляваща стойност. Медианата е мярка на централната тенденция, която не е толкова чувствителна към крайните стойности (най-ниската и най-високата), за разлика от средната стойност, която може да бъде повлияна от няколко прекалено високи или прекалено ниски стойности. Мода Модата приема числовата стойност на онова значение на признака, което се наблюдава с най-голяма честота (при най-много единици от изучаваната съвкупност), с други думи – какво е „модерно” в изследваните случаи (извадката) – кое се среща най-често...
  • 14. Друг източник на подобно съдържателно обсъждане на статистическата обработка са корелационните зависимости. Между ефекторните въпроси и детерминантите (напр. да се прецени дали постоянната величина, напр. „мъж” може да влияе на променливата, например „удовлетвореност от работата”) може да съществува зависимост, която се проверява с помощта на корелационни коефициенти. Изборът става задължително в зависимост от скалите, с които се работи. Корелационните коефициенти се изчисляват по следния алгоритъм:
  • 15. Analyze  Descriptive Statistics  Crosstabs (избираме изчисляването на двумерни разпределения)  избираме имената на променливите, смятани за ефекторни  преместваме променливите в първия прозорец с надпис Rows  имена на променливи (избираме по същия начин имената на променливите, считани за детерминанти)  преместваме променливите във втория прозорец с надпис Columns  Statistics  Chi - square  Continue  OK
  • 16. Хи-квадрат Хи-квадрат-анализът служи за проверка на статистически хипотези относно това дали съществува връзка между две качествени променливи, например: между пола и оценката на студентите на равнището на обучение във ВУЗ.
  • 17. В зависимост от скалите на отделните айтеми, с кликване на мишката върху радио-бутоните избираме подходящи коефициенти на корелация. Те са групирани в 3 карета: номинални скали и за 2-е променливи, рангови и номинална по интервална. Анализът за грешка За да може хи-квадрат да посочва наличие на корелационна връзка, трябва да бъде по-малък от 0,05 или 0,01 – 5 или 1 процент риск за грешка.
  • 18. Ако това равнище е постигнато, се оценява и величината на корелационния коефициент. Неговата абсолютна стойност е мярка за силата на корелацията: 0,000 – 0,333 – ниска по сила корелация 0,333 – 0,666 – седна по сила корелация 0,666 – 1,000 – висока по сила корелация Знакът „+” означава паралелно изменение на двете променливи: с нарастването на едната – нараства и другата, знакът „-” означава противоположното изменение: с нарастването стойността на причината (увеличаването на възрастта, напр., намалява удовлетвореността от работата) – намалява стойността на следствието, или с намаляването стойността на следствието – нараства стойността на причината (напр. с намаляването на свободното време, нараства неудовлетвореността от секса).
  • 19. Ако според вида на скалите се нуждаем от други корелационни коефициенти, те може да бъдат използвани и в друга обработка: Analyze  Correlate  Bivariate Коефициентите са следните: Пиърсън – за интервални скали; Тау Б на Кендъл – за ординални скали; Спи(ъ)рман – за рангови редици...