UK Gas Consumption
- 1. UK QUARTERLY GAS CONSUMPTION
จัดทำโดย
นำย กิตติพศ อำสำพิทักท์ชำติ รหัส 57010093
นำย ชัยชนะ สีทัด รหัส 57010093
รหัสวิชำ 1076253 : ควำมน่ำจะเป็นและสถิติ (PROBABILITY AND STATISTICS) ภำคเรียนที่ 2 ปี 2558
สำขำวิชำคอมพิวเตอร์ คณะวิศวกรรมศำสตร์ สถำบันเทคโนโลยีพระจอมเกล้ำเจ้ำคุณทหำรลำดกระบัง
Link: https://vincentarelbundock.github.io/Rdatasets/csv/datasets/UKgas.csv
https://vincentarelbundock.github.io/Rdatasets/doc/datasets/UKgas.html
- 2. สำรบัญ
หัวเรื่อง สไลด์ที่
• ข้อมูลตัวอย่ำง 4
• ขั้นตอนกำรหำค่ำทำงสถิติแบบง่ำย โดยใช้โปรแกรม RStudio 5
• วิธีกำรเตรียมข้อมูล พร้อมภำพประกอบ 6
• กำรเรียกใช้ฟังชั่นต่ำงๆในทำงสถิติ 7
• วิธีกำรสร้ำงกรำฟ 9
• กรำฟต่ำงๆของตัวแปร UK GAS 11
• กรำฟต่ำงๆของตัวแปร Time 20
• สรุปผล 29
- 6. วิธีกำรเตรียมข้อมูล พร้อมภำพประกอบ
1. เปิดโปรแกรม Rstudio ขึ้นมา
2. จากนั้นใช้คาสั่ง getwd() เพื่อให้เราทราบ file directory ของโปรแกรม R จากนั้นนาไฟล์ข้อมูล
(.csv) ไปไว้ใน file directory ดังกล่าว จากนั้นใช้คาสั่ง data <- read.csv(“ชื่อไฟล์”) เพื่อ
นาข้อมูลเข้ามาใช้
- 7. กำรเรียกใช้ฟังชั่นต่ำงๆในทำงสถิติ
1. ขั้นแรกเราต้องเตรียมข้อมูล โดยใช้คาสั่ง data <- read.csv(“ชื่อ
ไฟล์”) เพื่อที่เราจะได้สามารถนาข้อมูลมาใช้งานได้ โดยข้อมูลนั้นจะถูกเก็บอยู่ใน
ตัวแปรในโปรแกรม R
3. หาค่าเฉลี่ยจากคาสั่ง mean(data$ชื่อตัวแปร)
4. หาค่ามัธยฐานจากคาสั่ง median(data$ชื่อตัวแปร)
5. ใน R จะไม่มีคาสั่งในการหาฐานนิยมโดยตรงแต่สามารถทาได้โดยใช้คาสั่ง
which(table(data$ชื่อตัวแปร) == max(table(data$ชื่อ
ตัวแปร)))
2. เราสามารถเรียกใช้ข้อมูลได้จากการใช้ data ต่อด้วยชื่อตัวแปรข้อมูลของ
เรา โดยจะต้องคั่นด้วย $ จากภาพด้านขวาจะใช้ data$UKgas เพื่อดึง
ข้อมูลของ Ukgas ออกมาแสดงในรูปแบบ Vector
- 10. HISTOGRAM GRAPH
1. ใช้คาสั่งดังนี้
ggplot(data,aes(UKgas))+geom_histogram(binwidth=154,colour=“Black”)
1.1 ggplot
-data เป็นข้อมูลจากไฟล์ .csv (จากตัวอย่างที่แล้ว)
-aes(x,y) เป็นการบอกให้ plot ตามแกน x แกน y แบบ
ไหน อิงจากค่าอะไร (ถ้าต้องการพล็อตค่าอื่นให้เปลี่ยนที่
UKgas)
-ถ้าไม่ใส่ค่า y จะถือว่าป็นการนับความถี่ของตัวแปรนั้นๆ
1.2 geom_histogram
- binwidth ค่าความกว้างในแต่ละชั้นของข้อมูล
- colour เป็นใส่สีให้กับขอบของแท่งกราฟ
จากที่เห็นฟังก์ชั่นด้านบนเราสามารถสังเกตได้ว่า ggplot นั้นเอาไว้กาหนดว่าแกน x แกน y จะมีข้อมูลแบบไหน และฟังก์ชั่นที่สองสามารถ
เพิ่มเข้าไปเพื่อบ่งบอกให้โปรแกรมนี้พล็อตกราฟในรูปแบบใด ซึ่งเรายังสามารถกาหนดคุณลักษณะต่างของกราฟที่เราจะพล็อตได้ด้วยเช่นความ
กว้างหรือสีของแท่งกราฟ
- 15. 4. ถ้าเราทาแบบเดียวกันกับข้อ 3 ให้ฟังก์ชั่น GEOM_FREQPOLY จะได้เป็น OGIVE มาโดยการเพิ่มในส่วนของโค้ด
+GEOM_FREQPOLY(BINWIDTH=154,COLOUR="GREEN")
OGIVE
- 18. STEM & LEAF
5. ใช้คาสั่ง stem(vector,scale=n) เพื่อให้ทาการพล็อตข้อมูลนั้นๆในรูปแบบของ stem&leaf
(n = จานวนเต็มใดๆใช้ในการกาหนดความละเอียด stem)
- 19. 6. ใช้คาสั่ง BOXPLOT(VECTOR) เพื่อทาการพล็อตข้อมูลนั้นๆในรูปแบบ BOX PLOT (สามารถใช้ VECTOR กี่อันก็ได้
และตั้งชื่อผ่านพารามิเตอร์ NAMES หรือ XLAB)
- BOXPLOT(DATA$UKGAS)
BOX PLOT