คณิตศาสตร์
สถิติและข้อมูล

สถิติ หมายถึง ศาสตร์ที่นำมากระทำกับหลักฐานที่เป็นข้อมูลซึ่งอาจจะเป็นข้อมูลเชิงปริมาณหรือเชิงคุณภาพ โดยมีวิธีการกระทำได้แก่ การเก็บรวบรวมข้อมูล การนำเสนอข้อมูล การวิเคราะห์โดยใช้หลักการทางคณิตศาสตร์ และการนำผลการวิเคราะห์มาสรุป
ประเภทของสถิติศาสตร์ แบ่งได้เป็น 2 ประเภทใหญ่ ๆ ได้แก่
1. สถิติเชิงพรรณนา (Descriptive Statistics) เป็นสถิติที่บรรยายถึงคุณลักษณะของสิ่งที่กำลังต้องการศึกษา ;ว่าด้วยการสรุปข้อมูลแต่ละชุดที่เราสนใจ ค่าวัดแนวโน้มสู่ส่วนกลาง (ค่าเฉลี่ยเลขคณิต , มัธยฐาน , ฐานนิยม) ค่าวัดการกระจายข้อมูล ( ส่วนเบี่ยงเบนมาตรฐาน, พิสัย)
2. สถิติเชิงอนุมาน (Inferential Statistics) เป็นสถิติที่ศึกษาข้อมูลที่เป็นกลุ่มตัวอย่างเพียงกลุ่มเดียว จากข้อมูลของประชากรทั้งหมด
คำศัพท์ที่เกี่ยวข้องกับ สถิติ
1. ประชากร (population) หมายถึง กลุ่มที่มีลักษณะที่เราสนใจ หรือกลุ่มที่เราต้องการจะศึกษาหาข้อมูลที่เกี่ยวข้อง เปรียบเหมือนเอกภพสัมพัทธ์ในเรื่องเซต
2. กลุ่มตัวอย่าง (sample) หมายถึง ส่วนหนึ่งของกลุ่มประชากรที่เราสนใจ ในกรณีที่กลุ่มประชากรที่จะศึกษานั้นเป็นกลุ่มขนาดใหญ่ เกินความสามารถหรือความจำเป็นที่ต้องการ หรือเพื่อประหยัดในด้านงบประมาณและเวลา สามารถศึกษาข้อมูลเพียงบางส่วนของกลุ่มประชากรได้
3. ค่าพารามิเตอร์ หมายถึง ค่าต่างๆที่คำนวณมาจากกลุ่มประชากร จะถือเป็นค่าคงตัว กล่าวคือ คำนวณกี่ครั้งๆก็จะไม่เปลี่ยนแปลง
4. ค่าสถิต หมายถึง ค่าต่างๆที่คำนวณมาจากกลุ่มตัวอย่าง จะเป็นค่าที่เปลี่ยนแปลงได้ตจามกลุ่มตัวอย่างที่เลือกสุ่มมา จึงถือว่าเป็นค่าตัวแปรสุ่ม
5. ตัวแปร ในทางสถิติ หมายถึง ลักษณะบางอย่างที่เราสนใจ ค่าของตัวแปร อาจอยู่ในรูปข้อความ หรือตัวเลขก็ได้
6. ค่าที่เป็นไปได้ หมายถึง ค่าของตัวแปรที่อาจจะเกิดขึ้นได้จริง
7. ค่าจากการสังเกต หมายถึง ค่าที่เก็บรวบรวมได้มาจริงๆ
ข้อมูลและการเก็บรวบรวมข้อมูล
ข้อมูล หมายถึง
ข้อเท็จจริงของสิ่งต่างๆที่อยู่รอบตัวเรา ไม่ว่าจะเป็น คน สัตว์ สิ่งของ สถานที่ต่าง
ๆ ธรรมชาติทั่วไป
ประเภทของข้อมูลอาจแบ่งออกได้หลายประเภทดังต่อไปนี้
1. แบ่งประเภทข้อมูลตามวิธีการเก็บรวบรวมข้อมูล สามารถแบ่งออกได้เป็น 2 ประเภท
1.1 ข้อมูลปฐมภูมิ (Primary Data) หมายถึง ข้อมูลที่ผู้ใช้เป็นผู้เก็บรวบรวมข้อมูล ขึ้นเอง เช่น การเก็บแบบสอบถาม การทดลองในห้องทดลอง
1.2 ข้อมูลทุติยภูมิ (Second Data) หมายถึง ข้อมูลที่ผู้ใช้นำมาจากหน่วยงานอื่น หรือผู้อื่นที่ได้ทำการเก็บรวบรวมมาแล้วในอดีต เช่น รายงานประจำปีของหน่วยงานต่างๆ ข้อมูลท้องถิ่นซึ่งแต่ละอบต.เป็นผู้รวบรวมไว้ ฯลฯ
2. แบ่งประเภทข้อมูลตามระดับการวัด สามารถแบ่งออกได้เป็น 4 ประเภท
2.1 ข้อมูลระดับนามบัญญัติ (Nominal Scale) หมายถึง ข้อมูลที่แบ่งเป็นกลุ่มเป็นพวก เช่น เพศ อาชีพ ศาสนา ผิวสี ฯลฯ ไม่สามารถนำมาจัดลำดับ หรือนำมาคำนวณได้
2.2 ข้อมูลระดับอันดับ (Ordinal Scale) หมายถึง ข้อมูลที่สามารถแบ่งเป็นกลุ่มได้ แล้วยังสามารถบอกอันดับที่ของความแตกต่างได้ แต่ไม่สามารถบอกระยะห่างของอันดับที่แน่นนอนได้ หรือไม่สามารถเปรียบเทียบได้ว่าอันดับที่จัดนั้นมีความแตกต่างกันของระยะห่างเท่าใด เช่น อันดับที่ของการสอบของนักศึกษา อันดับที่ของผู้เข้าประกวดนางสาวไทย ฯลฯ
2.3 ข้อมูลระดับอันตรภาค (Interval Scale) หมายถึง ข้อมูลที่มีช่วงห่าง หรือระยะห่างเท่าๆกัน สามารถวัดค่าได้แต่เป็นข้อมูลที่ไม่มีศูนย์แท้ เช่น อุณหภูมิ คะแนนสอบ ระดับผลการเรียน ฯลฯ
2.4 ข้อมูลระดับอัตราส่วน (Ratio Scale) หมายถึง ข้อมูลที่มีมาตราวัดหรือระดับการวัดที่สูงที่สุด คือ นอกจากสามารถแบ่งกลุ่มได้ จัดอันดับได้ มีช่วงห่างของข้อมูลเท่าๆกันแล้ว ยังเป็นข้อมูลที่มีศูนย์แท้ เช่น น้ำหนัก ส่วนสูง ระยะทาง รายได้ จำนวนต่างๆ ฯลฯ
3. แบ่งประเภทข้อมูลตามลักษณะของข้อมูล สามารถแบ่งได้
2 ประเภทดังนี้
3.1 ข้อมูลเชิงปริมาณ คือ ข้อมูลที่เป็นตัวเลขที่ใช้แทนขนาดหรือปริมาณที่วัดออกมา สามารถนำมาเปรียบเทียบข้อมูลได้ เช่นอายุ ส่วนสูง น้ำหนัก รายได้ ฯลฯ
3.2 ข้อมูลเชิงคุณภาพ คือ ข้อมูลที่ไม่สามารถวัดออกมาเป็นจำนวนได้แต่อธิบายลักษณะของข้อมูลนั้น ๆ เช่น เพศ ระดับการศึกษา ฯลฯ
ตัวอย่าง
- การหาโอกาสที่ฝนจะตก ได้มาจากการอาศัยความน่าจะเป็น
ซึ่งต้องอาศัยข้อมูลทั้งในอดีตและปัจจุบัน และวิธีวิเคราะห์เชิงสถิติเข้ามาช่วย
- ทดสอบประสิทธิผลของยารักษาโรค ได้มาจากการเก็บรวบรวมข้อมูลจากการทดลอง
- การควบคุมคุณภาพสินค้าที่ผลิต กำหนดวิธีการตามขั้นตอนของกระบวนการทางสถิติ
คือ ในขั้นตอนการเก็บข้อมูล
สถิติคณิตศาสตร์จะกำหนดวิธีการเก็บรวบรวมข้อมูลที่เหมาะสมว่าควรเป็นการเลือกตัวอย่าง(สุ่ม)
-การสำรวจความคิดเห็น (Poll) เก็บข้อมูลเฉพาะจากตัวอย่างของกลุ่มคนเท่านั้นก็เป็นการเพียงพอ
จะต้องใช้ความรู้ในวิชาสถิติที่เกี่ยวข้องกับวิธีเลือกตัวอย่างและการกำหนดขนาดตัวอย่างที่เหมาะสมกับระดับคุณภาพของผลลัพธ์ที่ต้องการ
การจัดทำแบบสำรวจ รวมทั้งวิธีการประมาณค่า(ค่าสัดส่วนประชากรที่เห็นด้วย etc.)
ความหมายของสถิติ -การเก็บรวบรวมและการวิเคราะห์ข้อมูล
เพื่อหาข้อสรุปจากข้อมูลที่เกี่ยวข้อง แล้วนำมาอธิบายปรากฏการณ์หนึ่ง หรือตอบคำถาม
etc. การวิเคราะห์ข้อมูล
แบ่งออกเป็นสองส่วน 1.สถิติเชิงพรรณนา
มุ่งวิเคราะห์เพื่ออธิบายในลักษณะกว้างๆ สรุปข้อมูลแต่ละชุดที่เราสนใจ ด้านการวัด
การวัดค่าแนวโน้มสู่ส่วนกลาง(ค่าเฉลี่ยเลขคณิต มัธยฐาน ฐานนิยม) ค่าวัดการกระจาย(ส่วนเบี่ยงเบนมาตรฐาน
พิสัย ฯลฯ) นำเสนอข้อมูลด้วยตาราง แผนภูมิ
2.สถิติเชิงอนุมาน การวิเคราะห์ข้อมูลที่เก็บรวบรวมเพื่อใช้อ้างอิง
จะมีการเลือกตัวอย่าง จากประชากร เพื่อเก็บข้อมูล
กระบวนการทางสถิติศาสตร์
1.เก็บรวบรวมข้อมูล
2.นำเสนอข้อมูล
3.วิเคราะห์ข้อมูล
4.สรุปผล
สารสนเทศ คือข้อมูลที่ผ่านการวิเคราะห์มาแล้ว
จำแนกข้อมูลตามวิธีการเก็บรวบรวมข้อมูล
1.ข้อมูลปฐมภูมิ จะเป็นการลงมือเก็บข้อมูลเอง
2.ข้อมูลทุติยภูมิ เป็นการนำข้อมูลที่ผู้อื่นเก็บไว้แล้ว มาใช้
จำแนกตามลักษณะข้อมูล
1.เชิงปริมาณ (เป็นตัวเลข) ใช้แทนขนาด
หรือปริมาณที่สามารถนำมาเปรียบเทียบกันได้โดยตรง (มักจะเป็นจำนวน) เช่น ส่วนสูง
อัตรา… จำนวนประชากรของประเทศ… ปริมาณการผลิต…
2.เชิงคุณภาพ (ไม่เป็นตัวเลข แต่เป็นคุณลักษณะเช่น
เพศชาย ขนาดกลาง etc.) ไม่สามารถนำมาเปรียบเทียบกันได้
แต่จะอธิบายลักษณะหรือคุณสมบัติ (ไม่เป็นจำนวน) เช่น เพศของสมาชิกในครอบครัว
สถานภาพสมรสของ… ความคิดเห็นของประชาชน… etc.
บทที่2 การวิเคราะห์ข้อมูลเบื้องต้น
การวิเคราะห์
-การแจกแจงความถี่ของข้อมูล
-การหาค่ากลางของข้อมูล (มัธยฐาน ฐานนิยม ค่าเฉลี่ย)
-การหาค่าการกระจายของข้อมูล (ส่วนเบี่ยงเบนมาตรฐาน)
ตัวแปร ลักษณะของประชากรที่สนใจ เปลี่ยนค่าได้ ทั้งคุณภาพ และปริมาณ
ค่าจากการสังเกต ค่าที่ได้จากการสังเกต
ค่าที่เป็นไปได้ ค่าที่เป็นไปได้จริงๆ อาจจะเท่า หรือไม่เท่า
กับค่าจากการสังเกตก็ได้ เช่น
คะแนนสอบ เต็ม 10 คะแนน ค่าจากการสังเกตที่ได้ คือ 10 แต่ค่าที่เป็นไปได้ คือ 11 เพราะคนที่ติด0 ก็ย่อมจะมี ย่อมเป็นไปได้ ที่ผู้เข้าสอบ จะทำข้อสอบไม่ได้เลยสักข้อ
และก็เป็นไปได้อีกเช่นกัน ที่ผู้เข้าสอบบางคน จะทำได้เต็มสิบ ฉะนั้น
ค่าที่เป็นไปได้ในกรณีนี้ ให้นับตั้งแต่ 0-10 จะได้ 11
ค่า
*class
= ค่าจากการสังเกต
*frequency
= ค่าที่เป็นไปได้
*class
เปิด = ไม่จำกัดจำนวน เช่น น้อยกว่า 43
class
ปิด = จำกัดจำนวนข้อมูลใน class เช่น 43-45
สรุปสูตร และความหมาย
พิสัย = (Xmax)-(Xmin)
ความกว้างของอันตรภาคชั้น = พิสัย/จำนวนอันตรภาคชั้น
หาขอบบน(มาก) = +0.5, ขอบล่าง(น้อย) = -0.5
หาดเป็นทศนิยม ให้เพิ่ม0เข้าไป เพิ่มตำแหน่งเข้าไปอีก
เช่น 0.05 ไรงี้
หาจุดกึ่งกลางของอันตรภาคชั้น(x) = (ค่าน้อย+ค่ามาก)/2
—-
จุดกึ่งกลางชั้น(x)
จำนวนข้อมูลทั้งหมด(N)
ความถี่(f)
ความถี่สะสม(F)
ความถี่สัมพัทธ์(f/N)
ความถี่สะสมสัมพัทธ์(F/N)
ความถี่คูณจุดกึ่งกลางชั้น(fx)
Σf = N
—–
เขียน histogram ,polygon,curve ต้องย่นกราฟ และเริ่มจาก x
ก่อนหน้า(invisible) เสมอ ,แนวตั้ง=N ,แนวนอน=f
การวัดตำแหน่งของข้อมูล
Pr
= r(N+1)/100 |ex. P65 (<65%)|
Qr
= r(N+1)/4 |ex. Q3 (<3/4 ,less than 3 of 4)
Dr
= r(N+1)/10 |ex. D6 (<6/10,less than 6 of 10)
เมื่อหาค่าออกมาได้เท่าไหร่ ค่านั้น
คือตำแหน่งที่อยู่ของข้อมูล(ต้องเรียงข้อมูลจากน้อยไปมากก่อนทุกครั้ง) หากหาได้2 ตำแหน่งที่สองของข้อมูล
คือ 25(สมมติ) คำตอบก็จะเป็น 25 *หากหาค่าออกมาเป็นทศนิยม
ให้นำมาเทียบบรรญัติไตรยางค์ เช่นได้ 3.5 ซึ่งอยู่ในระหว่างตำแหน่งที่
3 และ 4 (ให้ตำแหน่งที่3 คือ10 และตำแหน่งที่4 คือ 15)
ระยะห่างระหว่างข้อมูล คือ 15-10 = 5 และระยะห่างระหว่างตำแหน่งคือ
1 เสมอ เกือบทุกกรณี นำผลลัพธ์ที่ได้จากการหาค่า P,Q,D
มาหักลบกับตำแหน่งที่ใกล้ที่สุด(น้อยกว่า) คือ ตำแหน่งที่3 คือ 3.5-3 = 0.5 จากนั้นนำค่าทั้งหมด มาเทียบ
โดยใช้สมการ 3คูณ0.5 ส่วน1
[(3*0.5)/1] หา 25% ของนักเรียน n คน(ถ้า 100 คน จะมี 25 คนสอบผ่าน
และถ้ามีนักเรียน n คน จะมีนักเรียน 9 คนสอบผ่าน
–> 9(25%)) ให้เทียบแบบนี้ (100*9)/25

ความคิดเห็น