Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Корреляционный анализ в системе R

2,494 views

Published on

Приведены примеры выполнения корреляционного анализа в среде статистических вычислений R.

Published in: Data & Analytics
  • Be the first to comment

Корреляционный анализ в системе R

  1. 1. Тема 7 Сергей Мастицкий БГУ, Минск, май 2014
  2. 2.  Корреляция отражает степень связи между двумя переменными  Коэффициент корреляции выражает эту степень количественно  -1 ≤ r ≤ +1 Author: Sergey Mastitsky
  3. 3. Author: Sergey Mastitsky Много примеров здесь: http://www.tylervigen.com/
  4. 4. 7.1. Коэффициент корреляции Пирсона Подробнее см.: http://r-analytics.blogspot.de/2012/09/blog-post_6280.html
  5. 5.  Предполагает, что:  обе переменные распределены нормально  связь линейна  Коэффициент корреляции Пирсона основан на расчете ковариации между двумя переменными:       22 )()( ))(( yyxx yyxx r ii ii Author: Sergey Mastitsky
  6. 6. > setwd("~/Introductory R Course/R_Course_Datasets")  В RStudio: Environment -> Load Workspace… -> … pH_experiment.rda Author: Sergey Mastitsky
  7. 7. > logL <- log(LWdata$Length) > logW <- log(LWdata$Weight) > cor(logL, logW) [1] 0.9807 # Если бы имелись отсутствующие значения: > cor(logL, logW, use = "complete.obs") # Для расчета r между всеми количественными переменными в таблице данных, следует просто подать эту таблицу на функцию cor() Author: Sergey Mastitsky
  8. 8. > cor.test(logL, logW) Author: Sergey Mastitsky
  9. 9. 7.2. Коэффициент корреляции Спирмена ()
  10. 10. Author: Sergey Mastitsky 2.5 3.0 3.5 -4-3-2-10 log scale logL logW 10 15 20 25 30 35 0.00.40.81.2 original scale Length Weight
  11. 11. Histogram of logL logL Frequency 2.0 2.5 3.0 3.5 0204060 Histogram of logW logW Frequency -4 -3 -2 -1 0 0204060 Histogram of exp(logL) Length Frequency 5 10 15 20 25 30 35 010203040 Histogram of exp(logW) Weight Frequency 0.0 0.2 0.4 0.6 0.8 1.0 1.2 04080120 Author: Sergey Mastitsky
  12. 12.  Не предполагает, что данные распределены каким-то особым образом  Вместо исходных значений использует их ранги  (!) Интерпретация не настолько проста, как в случае с коэффициентом Пирсона (т.к. связь необязательно линейна) Author: Sergey Mastitsky
  13. 13. > cor(logL, logW, method = "spearman") [1] 0.98196 Author: Sergey Mastitsky
  14. 14. > cor.test(logL, logW, method = "spearman") Author: Sergey Mastitsky

×