วิธีกำลังสองน้อยที่สุดช่วยให้คุณประเมินสมการถดถอยได้ วิธีการของกำลังสองน้อยที่สุดใช้ที่ไหน? รายการแหล่งที่ใช้

05.08.2021

การคาดการณ์ - นี่เป็นวิธีการวิจัยทางวิทยาศาสตร์ซึ่งมีพื้นฐานมาจากการเผยแพร่แนวโน้ม รูปแบบ ความสัมพันธ์กับการพัฒนาในอนาคตของวัตถุพยากรณ์ วิธีการคาดการณ์ ได้แก่ วิธีค่าเฉลี่ยเคลื่อนที่ วิธีปรับให้เรียบแบบเอ็กซ์โปเนนเชียล วิธีกำลังสองน้อยที่สุด

แก่นแท้ วิธีกำลังสองน้อยที่สุด ประกอบด้วยการลดผลรวมของค่าเบี่ยงเบนกำลังสองระหว่างค่าที่สังเกตได้และค่าที่คำนวณได้ ค่าที่คำนวณหาได้จากสมการที่เลือก - สมการถดถอย ยิ่งระยะห่างระหว่างค่าจริงกับค่าที่คำนวณได้น้อยเท่าไร การคาดการณ์ตามสมการถดถอยก็ยิ่งแม่นยำมากขึ้นเท่านั้น

การวิเคราะห์เชิงทฤษฎีของสาระสำคัญของปรากฏการณ์ที่กำลังศึกษา การเปลี่ยนแปลงที่แสดงโดยอนุกรมเวลา ทำหน้าที่เป็นพื้นฐานสำหรับการเลือกเส้นโค้ง การพิจารณาเกี่ยวกับธรรมชาติของการเติบโตของระดับของซีรีส์นั้นบางครั้งก็ถูกนำมาพิจารณาด้วย ดังนั้น หากคาดหวังการเติบโตของผลลัพธ์ในความก้าวหน้าทางคณิตศาสตร์ การปรับให้เรียบจะดำเนินการเป็นเส้นตรง หากปรากฎว่าการเติบโตเป็นแบบเลขชี้กำลัง ก็ควรทำการปรับให้เรียบตามฟังก์ชันเลขชี้กำลัง

สูตรการทำงานของวิธีกำลังสองน้อยที่สุด : Y t+1 = a*X + bโดยที่ t + 1 คือระยะเวลาคาดการณ์ Уt+1 – ตัวบ่งชี้ที่คาดการณ์ไว้; a และ b - สัมประสิทธิ์; เอ็กซ์ - สัญลักษณ์เวลา.

ค่าสัมประสิทธิ์ a และ b คำนวณตามสูตรต่อไปนี้:

โดยที่ Uf - ค่าที่แท้จริงของชุดไดนามิก n คือจำนวนระดับในอนุกรมเวลา

การปรับอนุกรมเวลาให้เรียบโดยวิธีกำลังสองน้อยที่สุดทำหน้าที่สะท้อนรูปแบบการพัฒนาของปรากฏการณ์ที่กำลังศึกษาอยู่ ในนิพจน์การวิเคราะห์ของแนวโน้ม เวลาถือเป็นตัวแปรอิสระ และระดับของอนุกรมทำหน้าที่เป็นฟังก์ชันของตัวแปรอิสระนี้

พัฒนาการของปรากฏการณ์ไม่ได้ขึ้นอยู่กับว่าผ่านไปกี่ปีนับจากจุดเริ่มต้น แต่ขึ้นอยู่กับปัจจัยใดบ้างที่มีอิทธิพลต่อการพัฒนาของมัน ในทิศทางใดและความรุนแรงระดับใด จากนี้ไปเป็นที่ชัดเจนว่าการพัฒนาของปรากฏการณ์ในเวลาอันเป็นผลมาจากการกระทำของปัจจัยเหล่านี้

การตั้งค่าประเภทของเส้นโค้งอย่างถูกต้อง ประเภทของการวิเคราะห์ขึ้นอยู่กับเวลาเป็นหนึ่งในงานที่ยากที่สุดของการวิเคราะห์ล่วงหน้า .

ทางเลือกของประเภทของฟังก์ชันที่อธิบายแนวโน้ม พารามิเตอร์ที่กำหนดโดยวิธีกำลังสองน้อยที่สุด ในกรณีส่วนใหญ่เป็นเชิงประจักษ์ โดยการสร้างฟังก์ชันจำนวนหนึ่งและเปรียบเทียบกันในแง่ของมูลค่าของรูท -mean-square error คำนวณโดยสูตร:

โดยที่ Uf - ค่าจริงของชุดไดนามิก Ur – ค่าที่คำนวณ (ปรับให้เรียบ) ของอนุกรมเวลา n คือจำนวนระดับในอนุกรมเวลา p คือจำนวนพารามิเตอร์ที่กำหนดไว้ในสูตรที่อธิบายแนวโน้ม (แนวโน้มการพัฒนา)

ข้อเสียของวิธีกำลังสองน้อยที่สุด :

  • เมื่อพยายามอธิบายปรากฏการณ์ทางเศรษฐศาสตร์ภายใต้การศึกษาโดยใช้สมการทางคณิตศาสตร์ การพยากรณ์จะแม่นยำในช่วงเวลาสั้นๆ และควรคำนวณสมการถดถอยใหม่เมื่อมีข้อมูลใหม่
  • ความซับซ้อนของการเลือกสมการถดถอยซึ่งแก้ได้โดยใช้โปรแกรมคอมพิวเตอร์มาตรฐาน

ตัวอย่างการใช้วิธีกำลังสองน้อยที่สุดในการพัฒนาการพยากรณ์

งาน . มีข้อมูลระบุระดับการว่างงานในภูมิภาค %

  • สร้างการคาดการณ์อัตราการว่างงานในภูมิภาคสำหรับเดือนพฤศจิกายน ธันวาคม มกราคม โดยใช้วิธีการ: ค่าเฉลี่ยเคลื่อนที่, การปรับให้เรียบแบบเอ็กซ์โปเนนเชียล, กำลังสองน้อยที่สุด
  • คำนวณข้อผิดพลาดในการคาดการณ์ผลลัพธ์โดยใช้แต่ละวิธี
  • เปรียบเทียบผลลัพธ์ที่ได้ วาดข้อสรุป

สารละลายกำลังสองน้อยที่สุด

สำหรับวิธีแก้ปัญหา เราจะทำตารางที่เราจะผลิต การคำนวณที่จำเป็น:

มากำหนดสัญลักษณ์ของเวลาเป็นลำดับเลขของช่วงเวลาของฐานการคาดการณ์ (คอลัมน์ 3) คำนวณคอลัมน์ที่ 4 และ 5 คำนวณค่าของซีรีส์ Ur จะถูกกำหนดโดยสูตร Y t + 1 = a * X + b โดยที่ t + 1 คือระยะเวลาคาดการณ์ Уt+1 – ตัวบ่งชี้ที่คาดการณ์ไว้; a และ b - สัมประสิทธิ์; X - สัญลักษณ์ของเวลา

สัมประสิทธิ์ a และ b ถูกกำหนดโดยสูตรต่อไปนี้:

โดยที่ Uf - ค่าที่แท้จริงของชุดไดนามิก n คือจำนวนระดับในอนุกรมเวลา
a = / = - 0.17
b \u003d 22.13 / 10 - (-0.17) * 55 / 10 \u003d 3.15

เราคำนวณข้อผิดพลาดสัมพัทธ์โดยเฉลี่ยโดยใช้สูตร:

ε = 28.63/10 = 2.86% คาดการณ์ความแม่นยำสูง.

เอาท์พุต : เปรียบเทียบผลลัพธ์ที่ได้จากการคำนวณ วิธีค่าเฉลี่ยเคลื่อนที่ , การปรับให้เรียบแบบเลขชี้กำลัง และวิธีกำลังสองน้อยที่สุด เราสามารถพูดได้ว่าข้อผิดพลาดสัมพัทธ์เฉลี่ยในการคำนวณโดยวิธีการทำให้เรียบแบบเอ็กซ์โพเนนเชียลอยู่ภายใน 20-50% ซึ่งหมายความว่าความแม่นยำในการทำนายในกรณีนี้เป็นเพียงที่น่าพอใจเท่านั้น

ในกรณีแรกและกรณีที่สาม ความแม่นยำในการคาดการณ์สูง เนื่องจากข้อผิดพลาดสัมพัทธ์เฉลี่ยน้อยกว่า 10% แต่วิธีค่าเฉลี่ยเคลื่อนที่ทำให้ได้ผลลัพธ์ที่น่าเชื่อถือมากขึ้น (การคาดการณ์สำหรับเดือนพฤศจิกายน - 1.52%, การคาดการณ์สำหรับเดือนธันวาคม - 1.53%, การพยากรณ์สำหรับเดือนมกราคม - 1.49%) เนื่องจากข้อผิดพลาดสัมพัทธ์เฉลี่ยเมื่อใช้วิธีนี้มีขนาดเล็กที่สุด - 1 ,13%.

เราประมาณฟังก์ชันด้วยพหุนามดีกรีที่ 2 ในการทำเช่นนี้ เราคำนวณสัมประสิทธิ์ของระบบสมการปกติ:

, ,

ให้เราเขียนระบบปกติที่มีกำลังสองน้อยที่สุดซึ่งมีรูปแบบดังนี้

วิธีแก้ปัญหาของระบบหาง่าย:, , .

ดังนั้น จะพบพหุนามของดีกรีที่ 2 ดังนี้

การอ้างอิงทางทฤษฎี

กลับไปที่หน้า<Введение в вычислительную математику. Примеры>

ตัวอย่าง 2. การหาดีกรีที่เหมาะสมของพหุนาม

กลับไปที่หน้า<Введение в вычислительную математику. Примеры>

ตัวอย่างที่ 3. ที่มาของระบบสมการปกติเพื่อหาพารามิเตอร์ของการพึ่งพาอาศัยกันเชิงประจักษ์

ให้เราหาระบบสมการเพื่อหาค่าสัมประสิทธิ์และฟังก์ชัน ซึ่งทำการประมาณค่ารูต-ค่าเฉลี่ย-กำลังสอง ฟังก์ชันที่กำหนดตามคะแนน เขียนฟังก์ชัน และเขียนเงื่อนไขสุดขั้วที่จำเป็นสำหรับมัน:

จากนั้นระบบปกติจะอยู่ในรูปแบบ:

เราได้รับระบบเชิงเส้นของสมการเทียบกับ พารามิเตอร์ที่ไม่รู้จักและที่แก้ไขได้ง่าย

การอ้างอิงทางทฤษฎี

กลับไปที่หน้า<Введение в вычислительную математику. Примеры>

ตัวอย่าง.

ข้อมูลการทดลองเกี่ยวกับค่าของตัวแปร Xและ ที่จะได้รับในตาราง

อันเป็นผลมาจากการจัดตำแหน่งฟังก์ชัน

โดยใช้ วิธีกำลังสองน้อยที่สุด, ประมาณข้อมูลเหล่านี้ด้วยการพึ่งพาเชิงเส้น y=ax+b(ค้นหาตัวเลือก แต่และ ). ค้นหาว่าเส้นใดในสองบรรทัดดีกว่า (ในแง่ของวิธีกำลังสองน้อยที่สุด) ที่จัดแนวข้อมูลการทดลอง วาดรูป.

สาระสำคัญของวิธีการกำลังสองน้อยที่สุด (LSM)

ปัญหาคือการหาสัมประสิทธิ์ การพึ่งพาอาศัยกันเชิงเส้นโดยที่ฟังก์ชันของตัวแปรสองตัว แต่และ ใช้ค่าที่น้อยที่สุด นั่นคือเมื่อได้รับข้อมูล แต่และ ผลรวมของค่าเบี่ยงเบนกำลังสองของข้อมูลการทดลองจากเส้นตรงที่พบจะน้อยที่สุด นี่คือจุดรวมของวิธีกำลังสองน้อยที่สุด

ดังนั้น คำตอบของตัวอย่างจึงลดลงเหลือเพียงการหาค่าสุดโต่งของฟังก์ชันของตัวแปรสองตัว

ที่มาของสูตรการหาค่าสัมประสิทธิ์

ระบบของสมการสองสมการที่มีสองไม่ทราบค่าถูกรวบรวมและแก้ไข การหาอนุพันธ์บางส่วนของฟังก์ชัน ตามตัวแปร แต่และ เราให้อนุพันธ์เหล่านี้เท่ากับศูนย์

เราแก้ระบบผลลัพธ์ของสมการด้วยวิธีใดก็ได้ (เช่น วิธีการทดแทนหรือวิธีของแครมเมอร์) และรับสูตรการหาค่าสัมประสิทธิ์โดยใช้วิธีกำลังสองน้อยที่สุด (LSM)

ด้วยข้อมูล แต่และ การทำงาน ใช้ค่าที่น้อยที่สุด หลักฐานของข้อเท็จจริงนี้มีให้ด้านล่างในข้อความที่ท้ายหน้า

นั่นคือวิธีทั้งหมดของกำลังสองน้อยที่สุด สูตรการหาค่าพารามิเตอร์ เอมีผลรวม , , , และพารามิเตอร์ คือปริมาณข้อมูลการทดลอง แนะนำให้คำนวณค่าของผลรวมเหล่านี้แยกกัน

ค่าสัมประสิทธิ์ พบหลังจากการคำนวณ เอ.

ถึงเวลาที่จะจำตัวอย่างเดิม

สารละลาย.

ในตัวอย่างของเรา n=5. เรากรอกตารางเพื่อความสะดวกในการคำนวณจำนวนเงินที่รวมอยู่ในสูตรของสัมประสิทธิ์ที่ต้องการ

ค่าในแถวที่สี่ของตารางนั้นได้มาจากการคูณค่าของแถวที่ 2 ด้วยค่าของแถวที่ 3 สำหรับแต่ละตัวเลข ฉัน.

ค่าในแถวที่ห้าของตารางนั้นได้มาจากการยกกำลังสองค่าของแถวที่ 2 สำหรับแต่ละตัวเลข ฉัน.

ค่าของคอลัมน์สุดท้ายของตารางคือผลรวมของค่าในแถวต่างๆ

เราใช้สูตรของวิธีกำลังสองน้อยที่สุดเพื่อหาสัมประสิทธิ์ แต่และ . เราแทนที่ค่าที่สอดคล้องกันจากคอลัมน์สุดท้ายของตาราง:

เพราะเหตุนี้, y=0.165x+2.184เป็นเส้นตรงโดยประมาณที่ต้องการ

มันยังคงที่จะหาว่าเส้นไหน y=0.165x+2.184หรือ ประมาณข้อมูลเดิมได้ดีกว่า กล่าวคือ ประมาณการโดยใช้วิธีกำลังสองน้อยที่สุด

การประมาณค่าความผิดพลาดของวิธีกำลังสองน้อยที่สุด

ในการทำเช่นนี้ คุณต้องคำนวณผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลดั้งเดิมจากเส้นเหล่านี้ และ ค่าที่น้อยกว่าจะสอดคล้องกับเส้นที่ใกล้เคียงกับข้อมูลดั้งเดิมได้ดีกว่าในแง่ของวิธีกำลังสองน้อยที่สุด

ตั้งแต่ แล้วบรรทัด y=0.165x+2.184ใกล้เคียงกับข้อมูลเดิมได้ดีขึ้น

ภาพประกอบกราฟิกของวิธีกำลังสองน้อยที่สุด (LSM)

ทุกอย่างดูดีบนชาร์ต เส้นสีแดงคือเส้นที่พบ y=0.165x+2.184, เส้นสีน้ำเงินคือ , จุดสีชมพูเป็นข้อมูลดั้งเดิม

มีไว้เพื่ออะไร ค่าประมาณเหล่านี้มีไว้เพื่ออะไร

โดยส่วนตัวแล้วฉันใช้เพื่อแก้ปัญหาการปรับข้อมูลให้เรียบ ปัญหาการประมาณค่าและการอนุมาน (ในตัวอย่างเดิม คุณอาจถูกขอให้ค้นหาค่าของค่าที่สังเกตได้ yที่ x=3หรือเมื่อไหร่ x=6ตามวิธีการของ MNC) แต่เราจะพูดถึงเรื่องนี้เพิ่มเติมในภายหลังในส่วนอื่นของเว็บไซต์

ด้านบนของหน้า

การพิสูจน์.

เพื่อว่าเมื่อพบแล้ว แต่และ ฟังก์ชั่นใช้ค่าที่น้อยที่สุด ณ จุดนี้เมทริกซ์ของรูปแบบกำลังสองของส่วนต่างอันดับสองสำหรับฟังก์ชัน เป็นบวกแน่นอน เอามาโชว์กัน

ความแตกต่างของลำดับที่สองมีรูปแบบ:

เช่น

ดังนั้นเมทริกซ์ของรูปแบบกำลังสองจึงมีรูปแบบ

และค่าขององค์ประกอบไม่ได้ขึ้นอยู่กับ แต่และ .

ให้เราแสดงว่าเมทริกซ์เป็นค่าบวกแน่นอน สิ่งนี้ต้องการให้มุมรองลงมาเป็นค่าบวก

เล็กน้อยเชิงมุมของคำสั่งแรก . ความไม่เท่าเทียมกันนั้นเข้มงวด เนื่องจากประเด็นไม่ตรงกัน สิ่งนี้จะส่อให้เห็นในสิ่งต่อไปนี้

เล็กน้อยเชิงมุมของลำดับที่สอง

มาพิสูจน์กัน วิธีการเหนี่ยวนำทางคณิตศาสตร์

เอาท์พุต: พบค่า แต่และ สอดคล้องกับค่าที่น้อยที่สุดของฟังก์ชัน จึงเป็นพารามิเตอร์ที่ต้องการสำหรับวิธีกำลังสองน้อยที่สุด

เคยเข้าใจไหม?
สั่งซื้อโซลูชัน

ด้านบนของหน้า

การพัฒนาการคาดการณ์โดยใช้วิธีกำลังสองน้อยที่สุด ตัวอย่างการแก้ปัญหา

การคาดการณ์ - นี่เป็นวิธีการวิจัยทางวิทยาศาสตร์ซึ่งมีพื้นฐานมาจากการเผยแพร่แนวโน้ม รูปแบบ ความสัมพันธ์กับการพัฒนาในอนาคตของวัตถุประสงค์ของการพยากรณ์ วิธีการคาดการณ์ ได้แก่ วิธีค่าเฉลี่ยเคลื่อนที่ วิธีปรับให้เรียบแบบเอ็กซ์โปเนนเชียล วิธีกำลังสองน้อยที่สุด

แก่นแท้ วิธีกำลังสองน้อยที่สุด ประกอบด้วยการลดผลรวมของค่าเบี่ยงเบนกำลังสองระหว่างค่าที่สังเกตได้และค่าที่คำนวณได้ ค่าที่คำนวณหาได้จากสมการที่เลือก - สมการถดถอย ยิ่งระยะห่างระหว่างค่าจริงกับค่าที่คำนวณได้น้อยเท่าไร การคาดการณ์ตามสมการถดถอยก็ยิ่งแม่นยำมากขึ้นเท่านั้น

การวิเคราะห์เชิงทฤษฎีของสาระสำคัญของปรากฏการณ์ที่กำลังศึกษา การเปลี่ยนแปลงที่แสดงโดยอนุกรมเวลา ทำหน้าที่เป็นพื้นฐานสำหรับการเลือกเส้นโค้ง การพิจารณาเกี่ยวกับธรรมชาติของการเติบโตของระดับของซีรีส์นั้นบางครั้งก็ถูกนำมาพิจารณาด้วย ดังนั้น หากคาดหวังการเติบโตของผลลัพธ์ในความก้าวหน้าทางคณิตศาสตร์ การปรับให้เรียบจะดำเนินการเป็นเส้นตรง หากปรากฎว่าการเติบโตเป็นแบบเลขชี้กำลัง ก็ควรทำการปรับให้เรียบตามฟังก์ชันเลขชี้กำลัง

สูตรการทำงานของวิธีกำลังสองน้อยที่สุด : Y t+1 = a*X + bโดยที่ t + 1 คือระยะเวลาคาดการณ์ Уt+1 – ตัวบ่งชี้ที่คาดการณ์ไว้; a และ b เป็นสัมประสิทธิ์; X เป็นสัญลักษณ์ของเวลา

ค่าสัมประสิทธิ์ a และ b คำนวณตามสูตรต่อไปนี้:

โดยที่ Uf - ค่าที่แท้จริงของชุดไดนามิก n คือจำนวนระดับในอนุกรมเวลา

การปรับอนุกรมเวลาให้เรียบโดยวิธีกำลังสองน้อยที่สุดทำหน้าที่สะท้อนรูปแบบการพัฒนาของปรากฏการณ์ที่กำลังศึกษาอยู่ ในนิพจน์การวิเคราะห์ของแนวโน้ม เวลาถือเป็นตัวแปรอิสระ และระดับของอนุกรมทำหน้าที่เป็นฟังก์ชันของตัวแปรอิสระนี้

พัฒนาการของปรากฏการณ์ไม่ได้ขึ้นอยู่กับว่าผ่านไปกี่ปีนับจากจุดเริ่มต้น แต่ขึ้นอยู่กับปัจจัยใดบ้างที่มีอิทธิพลต่อการพัฒนาของมัน ในทิศทางใดและความรุนแรงระดับใด จากนี้ไปเป็นที่ชัดเจนว่าการพัฒนาของปรากฏการณ์ในเวลาอันเป็นผลมาจากการกระทำของปัจจัยเหล่านี้

การตั้งค่าประเภทของเส้นโค้งอย่างถูกต้อง ประเภทของการวิเคราะห์ขึ้นอยู่กับเวลาเป็นหนึ่งในงานที่ยากที่สุดของการวิเคราะห์ล่วงหน้า .

ทางเลือกของประเภทของฟังก์ชันที่อธิบายแนวโน้ม พารามิเตอร์ที่กำหนดโดยวิธีกำลังสองน้อยที่สุด ในกรณีส่วนใหญ่เป็นเชิงประจักษ์ โดยการสร้างฟังก์ชันจำนวนหนึ่งและเปรียบเทียบกันตามค่าของรูท- ค่าคลาดเคลื่อนกำลังสอง คำนวณโดยสูตร:

โดยที่ Uf - ค่าจริงของชุดไดนามิก Ur – ค่าที่คำนวณ (ปรับให้เรียบ) ของอนุกรมเวลา n คือจำนวนระดับในอนุกรมเวลา p คือจำนวนพารามิเตอร์ที่กำหนดไว้ในสูตรที่อธิบายแนวโน้ม (แนวโน้มการพัฒนา)

ข้อเสียของวิธีกำลังสองน้อยที่สุด :

  • เมื่อพยายามอธิบายปรากฏการณ์ทางเศรษฐศาสตร์ภายใต้การศึกษาโดยใช้สมการทางคณิตศาสตร์ การพยากรณ์จะแม่นยำในช่วงเวลาสั้นๆ และควรคำนวณสมการถดถอยใหม่เมื่อมีข้อมูลใหม่
  • ความซับซ้อนของการเลือกสมการถดถอยซึ่งแก้ได้โดยใช้โปรแกรมคอมพิวเตอร์มาตรฐาน

ตัวอย่างการใช้วิธีกำลังสองน้อยที่สุดในการพัฒนาการพยากรณ์

งาน . มีข้อมูลระบุระดับการว่างงานในภูมิภาค %

  • สร้างการคาดการณ์อัตราการว่างงานในภูมิภาคสำหรับเดือนพฤศจิกายน ธันวาคม มกราคม โดยใช้วิธีการ: ค่าเฉลี่ยเคลื่อนที่, การปรับให้เรียบแบบเอ็กซ์โปเนนเชียล, กำลังสองน้อยที่สุด
  • คำนวณข้อผิดพลาดในการคาดการณ์ผลลัพธ์โดยใช้แต่ละวิธี
  • เปรียบเทียบผลลัพธ์ที่ได้ วาดข้อสรุป

สารละลายกำลังสองน้อยที่สุด

สำหรับวิธีแก้ปัญหา เราจะรวบรวมตารางที่เราจะทำการคำนวณที่จำเป็น:

ε = 28.63/10 = 2.86% คาดการณ์ความแม่นยำสูง.

เอาท์พุต : เปรียบเทียบผลลัพธ์ที่ได้จากการคำนวณ วิธีค่าเฉลี่ยเคลื่อนที่ , การปรับให้เรียบแบบเลขชี้กำลัง และวิธีกำลังสองน้อยที่สุด เราสามารถพูดได้ว่าข้อผิดพลาดสัมพัทธ์เฉลี่ยในการคำนวณโดยวิธีการทำให้เรียบแบบเอ็กซ์โพเนนเชียลอยู่ภายใน 20-50% ซึ่งหมายความว่าความแม่นยำในการทำนายในกรณีนี้เป็นเพียงที่น่าพอใจเท่านั้น

ในกรณีแรกและกรณีที่สาม ความแม่นยำในการคาดการณ์สูง เนื่องจากข้อผิดพลาดสัมพัทธ์เฉลี่ยน้อยกว่า 10% แต่วิธีค่าเฉลี่ยเคลื่อนที่ทำให้ได้ผลลัพธ์ที่น่าเชื่อถือมากขึ้น (การคาดการณ์สำหรับเดือนพฤศจิกายน - 1.52%, การคาดการณ์สำหรับเดือนธันวาคม - 1.53%, การพยากรณ์สำหรับเดือนมกราคม - 1.49%) เนื่องจากข้อผิดพลาดสัมพัทธ์เฉลี่ยเมื่อใช้วิธีนี้มีขนาดเล็กที่สุด - 1 ,13%.

วิธีกำลังสองน้อยที่สุด

บทความที่เกี่ยวข้องอื่นๆ:

รายการแหล่งที่ใช้

  1. คำแนะนำทางวิทยาศาสตร์และระเบียบวิธีในประเด็นของการวินิจฉัยความเสี่ยงทางสังคมและการคาดการณ์ความท้าทาย ภัยคุกคาม และผลกระทบทางสังคม มหาวิทยาลัยสังคมแห่งรัฐรัสเซีย มอสโก 2010;
  2. Vladimirova L.P. การพยากรณ์และการวางแผนในสภาวะตลาด: Proc. เบี้ยเลี้ยง. M.: สำนักพิมพ์ "Dashkov and Co", 2001;
  3. Novikova N.V. , Pozdeeva O.G. การพยากรณ์เศรษฐกิจแห่งชาติ: คู่มือการศึกษาและระเบียบวิธี. เยคาเตรินเบิร์ก: สำนักพิมพ์อูราล สถานะ เศรษฐกิจ มหาวิทยาลัย 2550;
  4. Slutskin แอล.เอ็น. หลักสูตร MBA ในการพยากรณ์ธุรกิจ มอสโก: หนังสือธุรกิจ Alpina, 2549

โครงการ MNE

ป้อนข้อมูล

ข้อมูลและการประมาณค่า y = a + b x

ฉัน- จำนวนจุดทดลอง
x ฉัน- ค่าของพารามิเตอร์คงที่ ณ จุด ฉัน;
ฉัน- ค่าของพารามิเตอร์ที่วัดได้ ณ จุด ฉัน;
ω ฉัน- วัดน้ำหนักที่จุด ฉัน;
ฉัน, คำนวณ.- ความแตกต่างระหว่างค่าที่วัดได้กับค่าที่คำนวณจากการถดถอย yณ จุดนั้น ฉัน;
ส x ผม (x ผม)- ประมาณการข้อผิดพลาด x ฉันเมื่อวัด yณ จุดนั้น ฉัน.

ข้อมูลและการประมาณค่า y = kx

ฉัน x ฉัน ฉัน ω ฉัน ฉัน, คำนวณ. Δy ฉัน ส x ผม (x ผม)

คลิกที่แผนภูมิ

คู่มือผู้ใช้สำหรับโปรแกรมออนไลน์ MNC

ในฟิลด์ข้อมูล ให้ป้อนค่า `x` และ `y` ในแต่ละบรรทัดแยกกันที่จุดทดลองจุดเดียว ค่าจะต้องคั่นด้วยช่องว่าง (ช่องว่างหรือแท็บ)

ค่าที่สามอาจเป็นน้ำหนักจุดของ "w" หากไม่ได้ระบุน้ำหนักจุด จะเท่ากับหนึ่ง ในกรณีส่วนใหญ่ ไม่ทราบน้ำหนักของจุดทดสอบหรือไม่ได้คำนวณ ข้อมูลการทดลองทั้งหมดถือว่าเทียบเท่า บางครั้งน้ำหนักในช่วงค่าที่ศึกษานั้นไม่เท่ากันอย่างแน่นอนและสามารถคำนวณได้ในทางทฤษฎี ตัวอย่างเช่น ในสเปกโตรโฟโตเมตรี สามารถคำนวณน้ำหนักได้โดยใช้สูตรง่ายๆ แม้ว่าโดยทั่วไปแล้ว ทุกคนจะละเลยสิ่งนี้เพื่อลดต้นทุนแรงงาน

สามารถวางข้อมูลผ่านคลิปบอร์ดจากสเปรดชีตของสำนักงาน เช่น Excel จาก Microsoft Office หรือ Calc จาก Open Office ในการดำเนินการนี้ ให้เลือกช่วงของข้อมูลที่จะคัดลอกในสเปรดชีต คัดลอกไปยังคลิปบอร์ด และวางข้อมูลลงในช่องข้อมูลในหน้านี้

ในการคำนวณด้วยวิธีกำลังสองน้อยที่สุด ต้องมีจุดอย่างน้อยสองจุดเพื่อกำหนดสองสัมประสิทธิ์ "b" - แทนเจนต์ของมุมเอียงของเส้นตรงและ "a" - ค่าที่ตัดโดยเส้นตรงบน "y ` แกน

ในการประมาณค่าความผิดพลาดของสัมประสิทธิ์การถดถอยที่คำนวณได้ จำเป็นต้องกำหนดจำนวนจุดทดสอบให้มากกว่าสองจุด

วิธีกำลังสองน้อยที่สุด (LSM)

ยิ่งจำนวนจุดทดลองมากเท่าไร ค่าประมาณทางสถิติของสัมประสิทธิ์ก็จะยิ่งแม่นยำมากขึ้นเท่านั้น (เนื่องจากค่าสัมประสิทธิ์ของนักเรียนลดลง) และค่าประมาณที่ใกล้เคียงกับค่าประมาณของกลุ่มตัวอย่างทั่วไปมากขึ้น

การได้รับค่าในแต่ละจุดทดลองมักเกี่ยวข้องกับต้นทุนแรงงานที่มีนัยสำคัญ ดังนั้นจึงมักมีการทดลองหลายครั้งซึ่งประนีประนอม ซึ่งให้ค่าประมาณที่ย่อยได้และไม่นำไปสู่ต้นทุนแรงงานที่มากเกินไป ตามกฎแล้ว จำนวนจุดทดลองสำหรับการพึ่งพากำลังสองน้อยที่สุดเชิงเส้นด้วยสองสัมประสิทธิ์จะถูกเลือกในพื้นที่ 5-7 จุด

ทฤษฎีสั้น ๆ ของกำลังสองน้อยที่สุดสำหรับการพึ่งพาอาศัยกันเชิงเส้น

สมมติว่าเรามีชุดข้อมูลการทดลองในรูปแบบของคู่ของค่า [`y_i`, `x_i`] โดยที่ `i` คือจำนวนของการวัดผลการทดลองหนึ่งครั้งตั้งแต่ 1 ถึง `n`; `y_i` - ค่าของค่าที่วัดได้ ณ จุด `i`; `x_i` - ค่าของพารามิเตอร์ที่เราตั้งไว้ที่จุด `i`

ตัวอย่างคือการดำเนินการของกฎของโอห์ม โดยการเปลี่ยนแรงดันไฟ (ความต่างศักย์) ระหว่างส่วนต่างๆ ของวงจรไฟฟ้า เราจะวัดปริมาณกระแสที่ไหลผ่านส่วนนี้ ฟิสิกส์ทำให้เรามีการพึ่งพาอาศัยกันที่พบในการทดลอง:

`ฉัน=U/R`,
โดยที่ `ฉัน` - ความแข็งแกร่งในปัจจุบัน `R` - ความต้านทาน; `U` - แรงดันไฟฟ้า

ในกรณีนี้ "y_i" คือค่าปัจจุบันที่วัดได้ และ "x_i" คือค่าแรงดันไฟ

อีกตัวอย่างหนึ่ง ให้พิจารณาการดูดกลืนแสงโดยสารละลายของสารในสารละลาย เคมีทำให้เรามีสูตร:

`A = εl C`,
โดยที่ `A` คือความหนาแน่นเชิงแสงของสารละลาย `ε` - การส่งผ่านตัวถูกละลาย; `l` - ความยาวเส้นทางเมื่อแสงผ่านคิวเวตต์ด้วยสารละลาย `C` คือความเข้มข้นของตัวถูกละลาย

ในกรณีนี้ "y_i" คือความหนาแน่นของแสงที่วัดได้ "A" และ "x_i" คือความเข้มข้นของสารที่เราตั้งค่าไว้

เราจะพิจารณากรณีที่ข้อผิดพลาดสัมพัทธ์ในการตั้งค่า `x_i` น้อยกว่าข้อผิดพลาดสัมพัทธ์ในการวัดค่า `y_i` มาก นอกจากนี้เรายังจะถือว่าค่าที่วัดได้ทั้งหมดของ `y_i` นั้นสุ่มและกระจายตามปกติเช่น ปฏิบัติตามกฎหมายการกระจายแบบปกติ

ในกรณีของการพึ่งพาเชิงเส้นของ "y" บน "x" เราสามารถเขียนการพึ่งพาทางทฤษฎีได้:
`y = a + bx`

จากมุมมองทางเรขาคณิต สัมประสิทธิ์ `b' หมายถึงแทนเจนต์ของมุมเอียงของเส้นไปยังแกน 'x' และสัมประสิทธิ์ `a' - ค่าของ 'y' ที่จุดตัดของ สอดคล้องกับแกน `y` (สำหรับ `x = 0`)

การหาค่าพารามิเตอร์ของเส้นถดถอย

ในการทดลอง ค่าที่วัดได้ของ "y_i" ไม่สามารถอยู่บนเส้นทฤษฎีได้อย่างแม่นยำเนื่องจากข้อผิดพลาดในการวัดซึ่งมีอยู่ใน ชีวิตจริง. ดังนั้น สมการเชิงเส้นต้องแสดงด้วยระบบสมการ:
`y_i = a + b x_i + ε_i` (1),
โดยที่ `ε_i` คือข้อผิดพลาดในการวัดที่ไม่รู้จักของ `y' ในการทดลองที่ `i`

การพึ่งพา (1) เรียกอีกอย่างว่า การถดถอย, เช่น. การพึ่งพาปริมาณทั้งสองซึ่งกันและกันโดยมีนัยสำคัญทางสถิติ

งานในการฟื้นฟูการพึ่งพาอาศัยกันคือการหาสัมประสิทธิ์ `a` และ `b` จากจุดทดลอง [`y_i`, `x_i`]

ในการหาค่าสัมประสิทธิ์ `a` และ `b` มักจะใช้ วิธีกำลังสองน้อยที่สุด(เอ็มเค). เป็นกรณีพิเศษของหลักการความน่าจะเป็นสูงสุด

ลองเขียน (1) ใหม่เป็น `ε_i = y_i - a - b x_i`

แล้วผลรวมของข้อผิดพลาดกำลังสองจะเป็น
`Φ = ผลรวม_(i=1)^(n) ε_i^2 = ผลรวม_(i=1)^(n) (y_i - a - b x_i)^2` (2)

หลักการของวิธีกำลังสองน้อยที่สุดคือการย่อผลรวม (2) ให้น้อยที่สุดโดยเทียบกับพารามิเตอร์ 'a' และ 'b'.

ถึงค่าต่ำสุดเมื่ออนุพันธ์บางส่วนของผลรวม (2) เทียบกับค่าสัมประสิทธิ์ "a" และ "b" เท่ากับศูนย์:
`frac(บางส่วน Φ)(บางส่วน) = frac(ผลรวมบางส่วน_(i=1)^(n) (y_i - a - b x_i)^2)(บางส่วน a) = 0`
`frac(บางส่วน Φ)(บางส่วน b) = frac(ผลรวมบางส่วน_(i=1)^(n) (y_i - a - b x_i)^2)(บางส่วน b) = 0`

จากการขยายอนุพันธ์ เราได้ระบบสมการสองสมการที่ไม่ทราบค่าสองค่า:
`sum_(i=1)^(n) (2a + 2bx_i - 2y_i) = sum_(i=1)^(n) (a + bx_i - y_i) = 0`
`sum_(i=1)^(n) (2bx_i^2 + 2ax_i - 2x_iy_i) = sum_(i=1)^(n) (bx_i^2 + ax_i - x_iy_i) = 0`

เราเปิดวงเล็บและโอนผลรวมที่ไม่ขึ้นกับสัมประสิทธิ์ที่ต้องการไปยังอีกครึ่งหนึ่ง เราจะได้ระบบสมการเชิงเส้น:
`sum_(i=1)^(n) y_i = a n + b sum_(i=1)^(n) bx_i`
`sum_(i=1)^(n) x_iy_i = ผลรวม _(i=1)^(n) x_i + b sum_(i=1)^(n) x_i^2`

ในการแก้ระบบผลลัพธ์ เราพบสูตรสำหรับสัมประสิทธิ์ "a" และ "b":

`a = frac(sum_(i=1)^(n) y_i sum_(i=1)^(n) x_i^2 - sum_(i=1)^(n) x_i sum_(i=1)^(n ) x_iy_i) (n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2)` (3.1)

`b = frac(n sum_(i=1)^(n) x_iy_i - sum_(i=1)^(n) x_i sum_(i=1)^(n) y_i) (n sum_(i=1)^ (n) x_i^2 - (sum_(i=1)^(n) x_i)^2)` (3.2)

สูตรเหล่านี้มีคำตอบเมื่อ `n > 1` (สามารถวาดเส้นได้อย่างน้อย 2 จุด) และเมื่อดีเทอร์มิแนนต์ `D = n sum_(i=1)^(n) x_i^2 — (sum_(i= 1 )^(n) x_i)^2 != 0`, เช่น เมื่อจุด `x_i` ในการทดสอบต่างกัน (เช่น เมื่อเส้นไม่อยู่ในแนวตั้ง)

การประมาณค่าความผิดพลาดในสัมประสิทธิ์ของเส้นถดถอย

สำหรับการประมาณค่าความผิดพลาดที่แม่นยำยิ่งขึ้นในการคำนวณค่าสัมประสิทธิ์ "a" และ "b" ขอแนะนำให้ใช้จุดทดสอบจำนวนมาก เมื่อ `n = 2` เป็นไปไม่ได้ที่จะประมาณความคลาดเคลื่อนของสัมประสิทธิ์เพราะ เส้นที่ใกล้เคียงจะผ่านจุดสองจุดโดยไม่ซ้ำกัน

ข้อผิดพลาดของตัวแปรสุ่ม `V` ถูกกำหนดแล้ว กฎการสะสมข้อผิดพลาด
`S_V^2 = ผลรวม_(i=1)^p (frac(บางส่วน f)(บางส่วน z_i))^2 S_(z_i)^2`,
โดยที่ `p` คือจำนวนของพารามิเตอร์ `z_i` ที่มีข้อผิดพลาด `S_(z_i)` ที่ส่งผลต่อข้อผิดพลาด `S_V`
`f` เป็นฟังก์ชันการพึ่งพาของ `V` บน `z_i`

ลองเขียนกฎการสะสมข้อผิดพลาดสำหรับข้อผิดพลาดของสัมประสิทธิ์ `a` และ `b`
`S_a^2 = sum_(i=1)^(n)(frac(บางส่วน a)(บางส่วน y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(บางส่วน a )(บางส่วน x_i))^2 S_(x_i)^2 = S_y^2 ผลรวม_(i=1)^(n)(frac(บางส่วน)(บางส่วน y_i))^2 `,
`S_b^2 = sum_(i=1)^(n)(frac(partial b)(partial y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(บางส่วน b )(บางส่วน x_i))^2 S_(x_i)^2 = S_y^2 ผลรวม_(i=1)^(n)(frac(บางส่วน b)(บางส่วน y_i))^2 `,
เพราะ `S_(x_i)^2 = 0` (ก่อนหน้านี้เราได้จองไว้ว่าข้อผิดพลาดของ `x` นั้นเล็กน้อย)

`S_y^2 = S_(y_i)^2` - ค่าคลาดเคลื่อน (ความแปรปรวน, ส่วนเบี่ยงเบนมาตรฐานกำลังสอง) ในมิติ 'y' โดยถือว่าข้อผิดพลาดนั้นเท่ากันสำหรับค่า 'y' ทั้งหมด

แทนที่สูตรสำหรับการคำนวณ `a` และ `b` ลงในนิพจน์ผลลัพธ์ เราจะได้

`S_a^2 = S_y^2 frac(sum_(i=1)^(n) (sum_(i=1)^(n) x_i^2 - x_i sum_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n sum_(i=1)^(n) x_i^2 - (sum_(i=1)^(n) x_i)^2) sum_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(sum_(i=1)^(n) x_i^2) (D)` (4.1)

`S_b^2 = S_y^2 frac(sum_(i=1)^(n) (n x_i - sum_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n sum_(i=1)^(n) x_i^2 - (sum_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) ` (4.2)

ในการทดลองจริงส่วนใหญ่ ค่าของ "Sy" จะไม่ถูกวัด ในการทำเช่นนี้ จำเป็นต้องทำการวัดขนานกันหลายๆ ครั้ง (การทดลอง) ที่จุดเดียวหรือหลายจุดของแผน ซึ่งจะเป็นการเพิ่มเวลา (และอาจมีค่าใช้จ่าย) ของการทดสอบ ดังนั้นจึงมักถือว่าค่าเบี่ยงเบนของ 'y' จากเส้นถดถอยสามารถพิจารณาได้แบบสุ่ม ค่าประมาณความแปรปรวน "y" ในกรณีนี้คำนวณโดยสูตร

`S_y^2 = S_(y, ส่วนที่เหลือ)^2 = frac(sum_(i=1)^n (y_i - a - b x_i)^2) (n-2)`

ตัวหาร `n-2' ปรากฏขึ้นเนื่องจากเราได้ลดจำนวนองศาอิสระลงเนื่องจากการคำนวณค่าสัมประสิทธิ์สองตัวสำหรับตัวอย่างข้อมูลการทดลองเดียวกัน

การประมาณนี้เรียกอีกอย่างว่าความแปรปรวนคงเหลือที่สัมพันธ์กับเส้นถดถอย `S_(y, rest)^2`

การประเมินความสำคัญของสัมประสิทธิ์ดำเนินการตามเกณฑ์ของนักเรียน

`t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)`

หากเกณฑ์ที่คำนวณได้ "t_a", "t_b" น้อยกว่าเกณฑ์ตาราง "t(P, n-2)" จะถือว่าสัมประสิทธิ์ที่สอดคล้องกันไม่แตกต่างจากศูนย์โดยมีความน่าจะเป็น "P"

ในการประเมินคุณภาพของคำอธิบายของความสัมพันธ์เชิงเส้น คุณสามารถเปรียบเทียบ `S_(y, rest)^2` และ `S_(bar y)` ที่สัมพันธ์กับค่าเฉลี่ยโดยใช้เกณฑ์ของ Fisher

`S_(บาร์ y) = frac(sum_(i=1)^n (y_i - บาร์ y)^2) (n-1) = frac(sum_(i=1)^n (y_i - (sum_(i=) 1)^n y_i) /n)^2) (n-1)` - ค่าประมาณตัวอย่างของความแปรปรวนของ `y' ที่สัมพันธ์กับค่าเฉลี่ย

ในการประเมินประสิทธิผลของสมการถดถอยเพื่ออธิบายการพึ่งพาอาศัยกัน ค่าสัมประสิทธิ์ฟิชเชอร์จะถูกคำนวณ
`F = S_(บาร์ y) / S_(y, พัก)^2`,
ซึ่งเปรียบเทียบกับค่าสัมประสิทธิ์ฟิชเชอร์ตาราง `F(p, n-1, n-2)`

ถ้า `F > F(P, n-1, n-2)` ความแตกต่างระหว่างคำอธิบายของการพึ่งพา `y = f(x)` โดยใช้สมการถดถอยและคำอธิบายโดยใช้ค่าเฉลี่ยจะถือว่ามีนัยสำคัญทางสถิติกับความน่าจะเป็น 'พี' เหล่านั้น. การถดถอยอธิบายถึงการพึ่งพาอาศัยกันได้ดีกว่าการแพร่กระจายของ "y" รอบค่าเฉลี่ย

คลิกที่แผนภูมิ
เพื่อเพิ่มคุณค่าให้กับตาราง

วิธีกำลังสองน้อยที่สุด วิธีการกำลังสองน้อยที่สุดหมายถึงการกำหนดพารามิเตอร์ที่ไม่รู้จัก a, b, c, การพึ่งพาฟังก์ชันที่ยอมรับได้

วิธีการกำลังสองน้อยที่สุดหมายถึงการกำหนดพารามิเตอร์ที่ไม่รู้จัก ก, ข, ค,…ยอมรับการพึ่งพาการทำงาน

y = f(x,a,b,c,…),

ซึ่งจะให้ค่าความแปรปรวนน้อยที่สุดของค่าความคลาดเคลื่อน

, (24)

โดยที่ x ผม , y ผม - ชุดของตัวเลขที่ได้จากการทดลอง

เนื่องจากเงื่อนไขส่วนปลายของฟังก์ชันของตัวแปรหลายตัวเป็นเงื่อนไขที่อนุพันธ์ย่อยบางส่วนมีค่าเท่ากับศูนย์ ดังนั้นพารามิเตอร์ ก, ข, ค,…ถูกกำหนดจากระบบสมการ:

; ; ; … (25)

ต้องจำไว้ว่าใช้วิธีกำลังสองน้อยที่สุดเพื่อเลือกพารามิเตอร์หลังจากรูปแบบของฟังก์ชัน y = ฉ(x)กำหนดไว้

ถ้าจากการพิจารณาทางทฤษฎีแล้ว เป็นไปไม่ได้ที่จะสรุปว่าสูตรเชิงประจักษ์ควรเป็นอย่างไร ถ้าอย่างนั้นก็ต้องอาศัยการแสดงแทนด้วยภาพก่อน ภาพกราฟิกข้อมูลที่สังเกตได้

ในทางปฏิบัติ ส่วนใหญ่มักจำกัดฟังก์ชันประเภทต่อไปนี้:

1) เชิงเส้น ;

2) กำลังสอง

มันถูกใช้กันอย่างแพร่หลายในทางเศรษฐมิติในรูปแบบของการตีความทางเศรษฐกิจที่ชัดเจนของพารามิเตอร์

การถดถอยเชิงเส้นจะลดลงเพื่อหาสมการของรูปแบบ

หรือ

พิมพ์สมการ อนุญาตให้ใช้ค่าพารามิเตอร์ที่กำหนด Xมีค่าทางทฤษฎีของคุณสมบัติที่มีประสิทธิภาพแทนที่ค่าจริงของตัวประกอบเข้าไป X.

การสร้างการถดถอยเชิงเส้นลงมาเพื่อประมาณค่าพารามิเตอร์ − แต่และ ใน.สามารถหาค่าประมาณพารามิเตอร์การถดถอยเชิงเส้นได้ด้วยวิธีต่างๆ

วิธีการแบบคลาสสิกในการประมาณค่าพารามิเตอร์การถดถอยเชิงเส้นจะขึ้นอยู่กับ สี่เหลี่ยมน้อยที่สุด(เอ็มเค).

LSM อนุญาตให้ได้รับค่าประมาณพารามิเตอร์ดังกล่าว แต่และ ใน,ซึ่งผลรวมของการเบี่ยงเบนกำลังสองของค่าจริงของลักษณะผลลัพธ์ (ญ)จากการคำนวณ (ตามทฤษฎี) ขั้นต่ำขั้นต่ำ:

ในการหาค่าต่ำสุดของฟังก์ชัน จำเป็นต้องคำนวณอนุพันธ์ย่อยตามค่าพารามิเตอร์แต่ละตัว แต่และ และเท่ากับศูนย์

ระบุโดย S แล้ว:

การแปลงสูตรเราได้รับระบบสมการปกติต่อไปนี้สำหรับการประมาณค่าพารามิเตอร์ แต่และ ใน:

การแก้ระบบสมการปกติ (3.5) ไม่ว่าจะด้วยวิธีการกำจัดตัวแปรแบบต่อเนื่องหรือโดยวิธีดีเทอร์มิแนนต์ เราก็หาค่าประมาณพารามิเตอร์ที่ต้องการ แต่และ ใน.

พารามิเตอร์ ในเรียกว่าสัมประสิทธิ์การถดถอย ค่าของมันแสดงการเปลี่ยนแปลงเฉลี่ยในผลลัพธ์โดยมีการเปลี่ยนแปลงปัจจัยหนึ่งหน่วย

สมการถดถอยจะเสริมด้วยตัวบ่งชี้ความหนาแน่นของความสัมพันธ์เสมอ เมื่อใช้การถดถอยเชิงเส้น สัมประสิทธิ์สหสัมพันธ์เชิงเส้นทำหน้าที่เป็นตัวบ่งชี้ มีการปรับเปลี่ยนสูตรสัมประสิทธิ์สหสัมพันธ์เชิงเส้นต่างๆ บางส่วนของพวกเขามีการระบุไว้ด้านล่าง:

ดังที่คุณทราบ สัมประสิทธิ์สหสัมพันธ์เชิงเส้นอยู่ภายในขอบเขต: -1 1.

ในการประเมินคุณภาพของการเลือกฟังก์ชันเชิงเส้น ให้คำนวณกำลังสอง

สัมประสิทธิ์สหสัมพันธ์เชิงเส้นเรียกว่า ค่าสัมประสิทธิ์การกำหนดค่าสัมประสิทธิ์การกำหนดลักษณะสัดส่วนของความแปรปรวนของคุณลักษณะที่มีประสิทธิภาพ คุณอธิบายโดยการถดถอยในความแปรปรวนทั้งหมดของลักษณะผลลัพธ์:

ดังนั้นค่า 1 - กำหนดสัดส่วนของการกระจายตัว คุณเกิดจากอิทธิพลของปัจจัยอื่นๆ ที่ไม่ได้นำมาพิจารณาในแบบจำลอง

คำถามเพื่อการควบคุมตนเอง

1. สาระสำคัญของวิธีการกำลังสองน้อยที่สุด?

2. มีตัวแปรกี่ตัวที่แสดงถึงการถดถอยแบบคู่?

3. ค่าสัมประสิทธิ์อะไรเป็นตัวกำหนดความหนาแน่นของการเชื่อมต่อระหว่างการเปลี่ยนแปลง

4. ค่าสัมประสิทธิ์ของการกำหนดกำหนดอยู่ภายในขอบเขตใด?

5. การประมาณค่าพารามิเตอร์ b ในการวิเคราะห์สหสัมพันธ์-ถดถอย?

1. คริสโตเฟอร์ โดเฮอร์ตี้ ความรู้เบื้องต้นเกี่ยวกับเศรษฐมิติ - M.: INFRA - M, 2001 - 402 p.

2. ส.อ. โบโรดิช. เศรษฐมิติ Minsk LLC "ความรู้ใหม่" 2544


3. ร.ร. Rakhmetova หลักสูตรระยะสั้นในเศรษฐมิติ กวดวิชา. อัลมาตี 2547. -78 วินาที.

4.I.I. Eliseeva เศรษฐมิติ. - ม.: "การเงินและสถิติ", 2002

5. ข้อมูลรายเดือนและนิตยสารเชิงวิเคราะห์

แบบจำลองเศรษฐกิจไม่เชิงเส้น แบบจำลองการถดถอยไม่เชิงเส้น การแปลงตัวแปร

โมเดลเศรษฐกิจไม่เชิงเส้น..

การแปลงตัวแปร

ค่าสัมประสิทธิ์ความยืดหยุ่น

หากมีความสัมพันธ์ที่ไม่เป็นเชิงเส้นระหว่างปรากฏการณ์ทางเศรษฐกิจ ก็จะแสดงโดยใช้ฟังก์ชันที่ไม่เป็นเชิงเส้นที่สอดคล้องกัน เช่น ไฮเพอร์โบลาด้านเท่า , พาราโบลาของดีกรีที่สอง ฯลฯ

การถดถอยแบบไม่เชิงเส้นมีสองประเภท:

1. การถดถอยที่ไม่เชิงเส้นตามตัวแปรอธิบายที่รวมอยู่ในการวิเคราะห์ แต่เป็นเชิงเส้นเมื่อเทียบกับพารามิเตอร์ที่ประมาณการไว้ เช่น

พหุนามขององศาต่างๆ - , ;

อติพจน์ด้านเท่ากันหมด - ;

ฟังก์ชันเซมิลอการิทึม - .

2. การถดถอยที่ไม่เป็นเชิงเส้นในพารามิเตอร์ประมาณการ เช่น

พลัง - ;

สาธิต -;

เอกซ์โพเนนเชียล - .

ผลรวมของการเบี่ยงเบนกำลังสองของค่าแต่ละค่าของแอตทริบิวต์ที่เป็นผลลัพธ์ ที่จากค่าเฉลี่ยนั้นเกิดจากอิทธิพลของหลายปัจจัย เราแบ่งชุดของเหตุผลทั้งหมดออกเป็นสองกลุ่มตามเงื่อนไข: ศึกษาปัจจัย xและ ปัจจัยอื่นๆ

หากปัจจัยไม่ส่งผลต่อผลลัพธ์ เส้นถดถอยบนกราฟจะขนานกับแกน โอ้และ

จากนั้นการกระจายทั้งหมดของแอตทริบิวต์ที่เป็นผลลัพธ์นั้นเกิดจากอิทธิพลของปัจจัยอื่นๆ และผลรวมของการเบี่ยงเบนกำลังสองทั้งหมดจะตรงกับส่วนที่เหลือ ถ้าปัจจัยอื่นไม่ส่งผลต่อผลลัพธ์แล้ว คุณผูกจาก Xตามการใช้งาน และผลรวมคงเหลือของกำลังสองเป็นศูนย์ ในกรณีนี้ ผลรวมของส่วนเบี่ยงเบนกำลังสองที่อธิบายโดยการถดถอยจะเท่ากับผลรวมของกำลังสองทั้งหมด

เนื่องจากไม่ใช่ทุกจุดของสนามสหสัมพันธ์จะอยู่บนเส้นการถดถอย ดังนั้นการกระจายจึงเกิดขึ้นเสมอเนื่องจากอิทธิพลของปัจจัย Xกล่าวคือ การถดถอย ที่บน เอ็กซ์,และเกิดจากการกระทำของสาเหตุอื่น (รูปแบบที่ไม่สามารถอธิบายได้) ความเหมาะสมของเส้นการถดถอยสำหรับการพยากรณ์ขึ้นอยู่กับส่วนใดของความแปรผันทั้งหมดของคุณลักษณะ ที่บัญชีสำหรับรูปแบบที่อธิบาย

แน่นอน ถ้าผลรวมของค่าเบี่ยงเบนกำลังสองเนื่องจากการถดถอยมากกว่าผลรวมของกำลังสอง สมการถดถอยจะมีนัยสำคัญทางสถิติและตัวประกอบ Xมีผลกระทบอย่างมากต่อผลลัพธ์ ย.

, นั่นคือ ด้วยจำนวนอิสระของการเปลี่ยนแปลงคุณลักษณะที่เป็นอิสระ จำนวนองศาอิสระสัมพันธ์กับจำนวนหน่วยของประชากร n และจำนวนค่าคงที่ที่กำหนดจากมัน ในความสัมพันธ์กับปัญหาที่กำลังศึกษา จำนวนองศาอิสระควรแสดงว่ามีการเบี่ยงเบนอิสระจาก . มากน้อยเพียงใด พี

การประเมินความสำคัญของสมการถดถอยโดยรวมทำได้โดยใช้ F- เกณฑ์ของฟิชเชอร์ ในกรณีนี้ จะมีการเสนอสมมติฐานว่างว่าสัมประสิทธิ์การถดถอยเท่ากับศูนย์ กล่าวคือ ข= 0 และด้วยเหตุนี้ตัวประกอบ Xไม่ส่งผลต่อผลลัพธ์ ย.

การคำนวณโดยตรงของเกณฑ์ F นำหน้าด้วยการวิเคราะห์ความแปรปรวน ศูนย์กลางของมันคือการขยายตัวของผลรวมทั้งหมดของส่วนเบี่ยงเบนกำลังสองของตัวแปร ที่จากค่าเฉลี่ย ที่ออกเป็นสองส่วน - "อธิบาย" และ "ไม่ได้อธิบาย":

ผลรวมของส่วนเบี่ยงเบนกำลังสอง

ผลรวมของค่าเบี่ยงเบนกำลังสองที่อธิบายโดยการถดถอย

ผลรวมคงเหลือของส่วนเบี่ยงเบนกำลังสอง

ผลรวมของค่าเบี่ยงเบนกำลังสองใดๆ สัมพันธ์กับจำนวนองศาอิสระ , นั่นคือ ด้วยจำนวนอิสระของการเปลี่ยนแปลงคุณลักษณะที่เป็นอิสระ จำนวนองศาอิสระสัมพันธ์กับจำนวนหน่วยประชากร และด้วยจำนวนค่าคงที่ที่กำหนดจากมัน ในความสัมพันธ์กับปัญหาที่กำลังศึกษา จำนวนองศาอิสระควรแสดงว่ามีการเบี่ยงเบนอิสระจาก . มากน้อยเพียงใด พีจำเป็นต้องสร้างผลรวมของกำลังสองที่กำหนด

การกระจายตัวต่อระดับความเป็นอิสระดี.

อัตราส่วน F (เกณฑ์ F):

ถ้าสมมุติฐานว่างเป็นจริงแล้วปัจจัยและความแปรปรวนที่เหลือก็ไม่ต่างกัน สำหรับ H 0 จำเป็นต้องมีการหักล้างเพื่อให้ค่าความแปรปรวนของปัจจัยเกินค่าคงเหลือหลายครั้ง นักสถิติชาวอังกฤษ Snedecor ได้พัฒนาตารางค่าวิกฤต F-ความสัมพันธ์ในระดับต่าง ๆ ของนัยสำคัญของสมมติฐานว่างและจำนวนองศาอิสระที่แตกต่างกัน ค่าตาราง F-criterion คือค่าสูงสุดของอัตราส่วนของความแปรปรวนที่อาจเกิดขึ้นได้หากค่าต่างกันแบบสุ่มสำหรับระดับความน่าจะเป็นที่กำหนดของการมีอยู่ของสมมติฐานว่าง ค่าที่คำนวณได้ F-ความสัมพันธ์ได้รับการยอมรับว่าเชื่อถือได้ถ้า o มากกว่าแบบตาราง

ในกรณีนี้ สมมติฐานว่างเกี่ยวกับการไม่มีความสัมพันธ์ของคุณลักษณะจะถูกปฏิเสธและมีการสรุปเกี่ยวกับความสำคัญของความสัมพันธ์นี้: F ข้อเท็จจริง > F ตาราง H 0 ถูกปฏิเสธ

ถ้าค่าน้อยกว่าตาราง F ความจริง ‹, F ตารางจากนั้นความน่าจะเป็นของสมมติฐานว่างจะสูงกว่าระดับที่กำหนดและไม่สามารถปฏิเสธได้หากไม่มีความเสี่ยงร้ายแรงในการสรุปข้อสรุปที่ไม่ถูกต้องเกี่ยวกับการมีอยู่ของความสัมพันธ์ ในกรณีนี้ สมการถดถอยถือว่าไม่มีนัยสำคัญทางสถิติ N o ไม่เบี่ยงเบน

ข้อผิดพลาดมาตรฐานของสัมประสิทธิ์การถดถอย

ในการประเมินความสำคัญของสัมประสิทธิ์การถดถอย ค่าของสัมประสิทธิ์จะถูกเปรียบเทียบกับค่าคลาดเคลื่อนมาตรฐาน กล่าวคือ กำหนดค่าจริง t-การทดสอบของนักเรียน: ซึ่งเปรียบเทียบกับค่าตารางที่ระดับนัยสำคัญที่แน่นอนและจำนวนองศาอิสระ ( - 2).

ข้อผิดพลาดมาตรฐานของพารามิเตอร์ แต่:

ความสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นถูกตรวจสอบตามขนาดของข้อผิดพลาด ค่าสัมประสิทธิ์สหสัมพันธ์ ร:

ความแปรปรวนทั้งหมดของคุณลักษณะ X:

การถดถอยเชิงเส้นพหุคูณ

การสร้างแบบจำลอง

การถดถอยพหุคูณเป็นการถดถอยของคุณลักษณะที่มีประสิทธิภาพซึ่งมีปัจจัยตั้งแต่สองปัจจัยขึ้นไป กล่าวคือ แบบจำลองของรูปแบบ

การถดถอยสามารถให้ผลลัพธ์ที่ดีในการสร้างแบบจำลองหากละเลยอิทธิพลของปัจจัยอื่นๆ ที่ส่งผลต่อวัตถุประสงค์ของการศึกษา ไม่สามารถควบคุมพฤติกรรมของตัวแปรทางเศรษฐกิจแต่ละรายการได้ กล่าวคือ ไม่สามารถรับประกันความเท่าเทียมกันของเงื่อนไขอื่น ๆ ทั้งหมดสำหรับการประเมินอิทธิพลของปัจจัยหนึ่งภายใต้การศึกษา ในกรณีนี้ คุณควรพยายามระบุอิทธิพลของปัจจัยอื่นๆ โดยการใส่ลงในแบบจำลอง เช่น สร้างสมการถดถอยพหุคูณ: y = a+b 1 x 1 +b 2 +…+b p x p + .

เป้าหมายหลักของการถดถอยพหุคูณคือการสร้างแบบจำลองที่มีปัจจัยจำนวนมาก ขณะที่กำหนดอิทธิพลของปัจจัยแต่ละอย่างเป็นรายบุคคล ตลอดจนผลกระทบสะสมต่อตัวบ่งชี้แบบจำลอง ข้อมูลจำเพาะของแบบจำลองประกอบด้วยคำถามสองส่วน: การเลือกปัจจัยและการเลือกประเภทของสมการถดถอย

3. การประมาณค่าฟังก์ชันโดยใช้เมธอด

สี่เหลี่ยมน้อยที่สุด

วิธีกำลังสองน้อยที่สุดใช้ในการประมวลผลผลลัพธ์ของการทดลองสำหรับ ค่าประมาณ (โดยประมาณ) ข้อมูลการทดลอง สูตรวิเคราะห์ รูปแบบเฉพาะของสูตรถูกเลือกตามกฎจากการพิจารณาทางกายภาพ สูตรเหล่านี้สามารถ:

และคนอื่น ๆ.

สาระสำคัญของวิธีกำลังสองน้อยที่สุดมีดังนี้ ให้ผลการวัดแสดงในตาราง:

โต๊ะ 4

x น

y n

(3.1)

ที่ไหน f เป็นฟังก์ชันที่ทราบ a 0, a 1 , …, m - พารามิเตอร์คงที่ที่ไม่รู้จักซึ่งต้องพบค่า ในวิธีกำลังสองน้อยที่สุด การประมาณของฟังก์ชัน (3.1) ถึงการพึ่งพาการทดลองจะถือว่าดีที่สุดหากเงื่อนไข

(3.2)

เช่น จำนวนเงิน เอ ความเบี่ยงเบนกำลังสองของฟังก์ชันการวิเคราะห์ที่ต้องการจากการพึ่งพาการทดลองควรน้อยที่สุด .

โปรดทราบว่าฟังก์ชันคิว เรียกว่า มองไม่เห็น


ตั้งแต่ความคลาดเคลื่อน

แล้วมีขั้นต่ำ เงื่อนไขที่จำเป็นสำหรับฟังก์ชันขั้นต่ำของตัวแปรหลายตัวคือความเท่าเทียมกันถึงศูนย์ของอนุพันธ์ย่อยทั้งหมดของฟังก์ชันนี้ตามพารามิเตอร์ ดังนั้นการหาค่าที่ดีที่สุดของพารามิเตอร์ของฟังก์ชันการประมาณ (3.1) นั่นคือค่าเหล่านั้นที่ Q = Q ( 0 , 1 , … , m ) น้อยที่สุด ลดการแก้ระบบสมการ:

(3.3)

วิธีการของกำลังสองน้อยที่สุดสามารถให้การตีความทางเรขาคณิตต่อไปนี้: ในบรรดากลุ่มอนันต์ของเส้นประเภทที่กำหนดพบหนึ่งเส้นซึ่งผลรวมของความแตกต่างกำลังสองในพิกัดของจุดทดลองและพิกัดที่สอดคล้องกันของจุด หาได้จากสมการเส้นนี้จะเล็กที่สุด

การหาค่าพารามิเตอร์ของฟังก์ชันเชิงเส้น

ให้ข้อมูลการทดลองแสดงด้วยฟังก์ชันเชิงเส้น:

จำเป็นต้องเลือกค่าดังกล่าว a และ b ซึ่งฟังก์ชัน

(3.4)

จะน้อยที่สุด เงื่อนไขที่จำเป็นสำหรับค่าต่ำสุดของฟังก์ชัน (3.4) จะลดลงเป็นระบบสมการ:

หลังจากการแปลง เราได้ระบบสมการเชิงเส้นสองสมการที่ไม่ทราบค่าสองค่า:

(3.5)

การแก้ปัญหา ซึ่ง เราพบค่าที่ต้องการของพารามิเตอร์ก และ ข .

การหาพารามิเตอร์ของฟังก์ชันกำลังสอง

หากฟังก์ชันการประมาณเป็นการพึ่งพากำลังสอง

จากนั้นพารามิเตอร์ของ a , b , c ค้นหาจากเงื่อนไขขั้นต่ำของฟังก์ชัน:

(3.6)

เงื่อนไขขั้นต่ำสำหรับฟังก์ชัน (3.6) จะลดลงเป็นระบบสมการ:


หลังจากการแปลง เราได้ระบบสมการเชิงเส้นสามสมการที่ไม่ทราบค่าสามค่า:

(3.7)

ที่ การแก้ปัญหาที่เราพบค่าที่ต้องการของพารามิเตอร์ก , ข และ ค .

ตัวอย่าง . ให้ตารางค่าต่อไปนี้ได้จากการทดลอง x และ y :

โต๊ะ 5

ฉัน

0,705

0,495

0,426

0,357

0,368

0,406

0,549

0,768

จำเป็นต้องประมาณข้อมูลการทดลองด้วยฟังก์ชันเชิงเส้นและฟังก์ชันกำลังสอง

สารละลาย. การหาพารามิเตอร์ของฟังก์ชันการประมาณจะลดเหลือการแก้ระบบสมการเชิงเส้น (3.5) และ (3.7) ในการแก้ปัญหา เราใช้ตัวประมวลผลสเปรดชีตเก่ง

1. ก่อนอื่นเราเชื่อมโยงแผ่นงาน 1 และ 2 ป้อนค่าทดลอง x ฉันและ ฉันเป็นคอลัมน์ A และ B เริ่มจากบรรทัดที่สอง (ในบรรทัดแรกเราใส่ส่วนหัวของคอลัมน์) จากนั้นเราคำนวณผลรวมของคอลัมน์เหล่านี้และใส่ไว้ในแถวที่สิบ

ในคอลัมน์ C–G วางการคำนวณและบวกตามลำดับ

2. ปลดแผ่นงาน การคำนวณเพิ่มเติมจะดำเนินการในลักษณะเดียวกันสำหรับการพึ่งพาเชิงเส้นบนแผ่นที่ 1 และการพึ่งพากำลังสองในแผ่นที่ 2

3. ภายใต้ตารางผลลัพธ์ เราสร้างเมทริกซ์ของสัมประสิทธิ์และเวกเตอร์คอลัมน์ของสมาชิกอิสระ มาแก้ระบบสมการเชิงเส้นตามอัลกอริธึมต่อไปนี้กัน:

ในการคำนวณ เมทริกซ์ผกผันและการคูณเมทริกซ์ เราใช้ ผู้เชี่ยวชาญ ฟังก์ชั่นและหน้าที่ MOBRและ มุมโนจ.

4. ในบล็อกเซลล์ H2:ชม 9 จากค่าสัมประสิทธิ์ที่ได้รับเราคำนวณ ค่าของการประมาณพหุนามฉัน แคล., ในบล็อก I 2: I 9 - การเบี่ยงเบน ดีฉัน = ฉัน exp. - ฉัน แคล., ในคอลัมน์ J - ความคลาดเคลื่อน:

ตารางที่ได้รับและสร้างขึ้นโดยใช้ ตัวช่วยสร้างแผนภูมิกราฟแสดงในรูปที่ 6, 7, 8


ข้าว. 6. ตารางคำนวณสัมประสิทธิ์ของฟังก์ชันเชิงเส้น

ประมาณข้อมูลการทดลอง


ข้าว. 7. ตารางคำนวณสัมประสิทธิ์ของฟังก์ชันกำลังสอง

ประมาณข้อมูลการทดลอง


ข้าว. 8. การแสดงกราฟิกของผลลัพธ์ของการประมาณ

ข้อมูลการทดลองฟังก์ชันเชิงเส้นและกำลังสอง

ตอบ. ข้อมูลการทดลองถูกประมาณโดยการพึ่งพาอาศัยกันเชิงเส้น y = 0,07881 x + 0,442262 มีเศษเหลือ คิว = 0,165167 และการพึ่งพากำลังสอง y = 3,115476 x 2 – 5,2175 x + 2,529631 มีเศษเหลือ คิว = 0,002103 .

งาน ประมาณฟังก์ชันที่กำหนดโดยฟังก์ชันตาราง เชิงเส้น และกำลังสอง

ตารางที่ 6

№0

x

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

y

3,030

3,142

3,358

3,463

3,772

3,251

3,170

3,665

1

3,314

3,278

3,262

3,292

3,332

3,397

3,487

3,563

2

1,045

1,162

1,264

1,172

1,070

0,898

0,656

0,344

3

6,715

6,735

6,750

6,741

6,645

6,639

6,647

6,612

4

2,325

2,515

2,638

2,700

2,696

2,626

2,491

2,291

5

1.752

1,762

1,777

1,797

1,821

1,850

1,884

1,944

6

1,924

1,710

1,525

1,370

1,264

1,190

1,148

1,127

7

1,025

1,144

1,336

1,419

1,479

1,530

1,568

1,248

8

5,785

5,685

5,605

5,545

5,505

5,480

5,495

5,510

9

4,052

4,092

4,152

4,234

4,338

4,468

4,599

ซึ่งพบการประยุกต์กว้างที่สุดในสาขาวิทยาศาสตร์และการปฏิบัติต่างๆ อาจเป็นฟิสิกส์ เคมี ชีววิทยา เศรษฐศาสตร์ สังคมวิทยา จิตวิทยา และอื่นๆ ตามความประสงค์ของโชคชะตาฉันมักจะต้องจัดการกับเศรษฐกิจดังนั้นวันนี้ฉันจะจัดตั๋วไปยังประเทศที่น่าอัศจรรย์ที่เรียกว่า เศรษฐมิติ=) … ไม่อยากได้อย่างนั้นหรือ! มันดีมากที่นั่น - คุณแค่ต้องตัดสินใจ! …แต่สิ่งที่คุณอาจต้องการอย่างแน่นอนคือการเรียนรู้วิธีแก้ปัญหา สี่เหลี่ยมน้อยที่สุด. และโดยเฉพาะอย่างยิ่งผู้อ่านที่ขยันจะเรียนรู้ที่จะแก้ปัญหาเหล่านี้ไม่เพียง แต่แม่นยำ แต่ยังเร็วมาก ;-) แต่ก่อนอื่น คำชี้แจงปัญหาทั่วไป+ ตัวอย่างที่เกี่ยวข้อง:

ให้ศึกษาตัวชี้วัดในบางสาขาวิชาที่มีนิพจน์เชิงปริมาณ ในเวลาเดียวกัน มีเหตุผลทุกประการที่จะเชื่อว่าตัวบ่งชี้ขึ้นอยู่กับตัวบ่งชี้ สมมติฐานนี้สามารถเป็นได้ทั้งสมมติฐานทางวิทยาศาสตร์และตามสามัญสำนึกเบื้องต้น อย่างไรก็ตาม ให้ทิ้งวิทยาศาสตร์ไว้ และสำรวจพื้นที่ที่น่ารับประทานมากขึ้น นั่นคือ ร้านขายของชำ แสดงโดย:

– พื้นที่ค้าปลีกของร้านขายของชำ ตร.ม.
- มูลค่าการซื้อขายประจำปีของร้านขายของชำ ล้านรูเบิล

เป็นที่ชัดเจนว่ายิ่งพื้นที่ของร้านใหญ่ขึ้นเท่าใดมูลค่าการซื้อขายของสินค้าก็จะยิ่งมากขึ้นเท่านั้น

สมมติว่าหลังจากการสังเกต / การทดลอง / การคำนวณ / การเต้นรำด้วยแทมบูรีน เรามีข้อมูลตัวเลขที่กำจัด:

สำหรับร้านขายของชำ ฉันคิดว่าทุกอย่างชัดเจน: - นี่คือพื้นที่ของร้านที่ 1 - มูลค่าการซื้อขายประจำปี - พื้นที่ของร้านที่ 2 - มูลค่าการซื้อขายประจำปี ฯลฯ โดยวิธีการที่ไม่จำเป็นต้องมีการเข้าถึงวัสดุที่เป็นความลับ - การประเมินมูลค่าการซื้อขายที่ถูกต้องอย่างเป็นธรรมสามารถทำได้โดยใช้ สถิติทางคณิตศาสตร์. อย่างไรก็ตามอย่าฟุ้งซ่านการจารกรรมเชิงพาณิชย์ได้จ่ายเงินไปแล้ว =)

ข้อมูลแบบตารางสามารถเขียนในรูปแบบของจุดและแสดงในลักษณะปกติสำหรับเรา ระบบคาร์ทีเซียน .

มาตอบคำถามสำคัญกัน: ต้องใช้กี่คะแนนในการศึกษาเชิงคุณภาพ?

ใหญ่กว่าดีกว่า. ชุดที่อนุญาตขั้นต่ำประกอบด้วย 5-6 คะแนน นอกจากนี้ ด้วยข้อมูลจำนวนเล็กน้อย ผลลัพธ์ที่ "ผิดปกติ" ไม่ควรรวมอยู่ในตัวอย่าง ตัวอย่างเช่น ร้านค้าเล็กๆ ระดับหัวกะทิเล็กๆ สามารถช่วยออกคำสั่งสำคัญๆ ได้มากกว่า "เพื่อนร่วมงาน" ซึ่งจะทำให้รูปแบบทั่วไปที่จำเป็นต้องพบบิดเบือนไป!

ถ้ามันค่อนข้างง่ายเราต้องเลือกฟังก์ชั่น กำหนดการที่ผ่านเข้าใกล้จุดมากที่สุด . ฟังก์ชันดังกล่าวเรียกว่า ประมาณ (การประมาณ - การประมาณ)หรือ ฟังก์ชันทางทฤษฎี . โดยทั่วไป คำว่า "เสแสร้ง" จะปรากฏที่นี่ทันที ซึ่งเป็นพหุนามของดีกรีสูง กราฟที่ลากผ่านจุดทั้งหมด แต่ตัวเลือกนี้ซับซ้อนและมักไม่ถูกต้อง (เพราะกราฟจะ “คดเคี้ยว” ตลอดเวลาและสะท้อนแนวโน้มหลักได้ไม่ดี).

ดังนั้นฟังก์ชันที่ต้องการจะต้องเรียบง่ายเพียงพอและในขณะเดียวกันก็สะท้อนการพึ่งพาอาศัยกันอย่างเพียงพอ อย่างที่คุณอาจเดาได้ วิธีหนึ่งในการค้นหาฟังก์ชันดังกล่าวเรียกว่า สี่เหลี่ยมน้อยที่สุด. อันดับแรก มาวิเคราะห์สาระสำคัญโดยทั่วไปกันก่อน ให้ฟังก์ชันบางอย่างประมาณข้อมูลการทดลอง:


จะประเมินความถูกต้องของการประมาณนี้ได้อย่างไร? ให้เราคำนวณความแตกต่าง (ส่วนเบี่ยงเบน) ระหว่างค่าทดลองและค่าการใช้งาน (เราศึกษาการวาดภาพ). ความคิดแรกที่เข้ามาในหัวคือการประมาณว่าผลรวมนั้นมากขนาดไหน แต่ปัญหาคือความแตกต่างอาจเป็นค่าลบได้ (ตัวอย่างเช่น, ) และการเบี่ยงเบนจากผลรวมดังกล่าวจะตัดกันออกไป ดังนั้น จากการประมาณความแม่นยําของการประมาณ จึงแนะนําตัวเองให้หาผลรวม โมดูลการเบี่ยงเบน:

หรือในรูปแบบพับ: (ทันใดนั้นใครไม่รู้: เป็นไอคอนผลรวมและเป็นตัวแปรเสริม - "ตัวนับ" ซึ่งรับค่าตั้งแต่ 1 ถึง ).

โดยการประมาณจุดทดลองด้วยฟังก์ชันต่างๆ เราจะได้ค่าต่างๆ ที่ต่างกัน และเห็นได้ชัดว่าเมื่อผลรวมนี้น้อยกว่า ฟังก์ชันนั้นจะแม่นยำกว่า

วิธีการดังกล่าวมีอยู่และเรียกว่า วิธีโมดูลัสน้อยที่สุด. อย่างไรก็ตามในทางปฏิบัติมันแพร่หลายมากขึ้น วิธีกำลังสองน้อยที่สุดซึ่งค่าลบที่เป็นไปได้นั้นไม่ได้ถูกกำจัดโดยโมดูลัส แต่โดยการยกกำลังสองส่วนเบี่ยงเบน:

หลังจากนั้นความพยายามจะมุ่งไปที่การเลือกฟังก์ชันดังกล่าวซึ่งผลรวมของการเบี่ยงเบนกำลังสอง มีขนาดเล็กที่สุด อันที่จริงแล้ว จึงเป็นที่มาของชื่อวิธีการ

และตอนนี้เรากลับมาที่อื่นแล้ว จุดสำคัญ: ดังที่กล่าวไว้ข้างต้น ฟังก์ชันที่เลือกควรจะค่อนข้างง่าย - แต่ก็มีฟังก์ชันดังกล่าวมากมายเช่นกัน: เชิงเส้น , ไฮเปอร์โบลิก, เลขชี้กำลัง, ลอการิทึม, กำลังสอง ฯลฯ และแน่นอนว่าฉันต้องการ "ลดขอบเขตของกิจกรรม" ทันที ประเภทของฟังก์ชั่นให้เลือกสำหรับการวิจัย? เทคนิคดั้งเดิมแต่ได้ผล:

- วิธีที่ง่ายที่สุดในการวาดคะแนน บนภาพวาดและวิเคราะห์ตำแหน่งของพวกเขา หากมีแนวโน้มเป็นเส้นตรง ก็ควรมองหา สมการเส้นตรง ด้วยค่าที่เหมาะสมและ . กล่าวอีกนัยหนึ่ง ภารกิจคือการหาสัมประสิทธิ์ดังกล่าว - เพื่อให้ผลรวมของการเบี่ยงเบนกำลังสองมีค่าน้อยที่สุด

ถ้าจุดต่างๆ เช่น ตาม อติพจน์ดังนั้นจึงเป็นที่ชัดเจนว่าฟังก์ชันเชิงเส้นจะให้ค่าประมาณที่ไม่ดี ในกรณีนี้ เรากำลังมองหาสัมประสิทธิ์ที่ "เหมาะสม" ที่สุดสำหรับสมการไฮเพอร์โบลา - ผู้ที่ให้ผลรวมของกำลังสองขั้นต่ำ .

ตอนนี้สังเกตว่าในทั้งสองกรณีเรากำลังพูดถึง หน้าที่ของสองตัวแปร, ซึ่งมีข้อโต้แย้งคือ ค้นหาตัวเลือกการพึ่งพา:

และโดยพื้นฐานแล้ว เราต้องแก้ปัญหามาตรฐาน - เพื่อค้นหา ฟังก์ชันขั้นต่ำของสองตัวแปร.

จำตัวอย่างของเรา: สมมติว่าจุด "ร้านค้า" มีแนวโน้มที่จะเป็นเส้นตรงและมีเหตุผลทุกประการที่จะเชื่อว่ามีอยู่ การพึ่งพาอาศัยกันเชิงเส้นมูลค่าการซื้อขายจากพื้นที่การค้า ลองหาสัมประสิทธิ์ดังกล่าว "a" และ "be" เพื่อให้ผลรวมของการเบี่ยงเบนกำลังสอง มีขนาดเล็กที่สุด ทุกอย่างเหมือนเดิม - ก่อน อนุพันธ์บางส่วนของคำสั่งที่ 1. ตาม กฎความเป็นเส้นตรงคุณสามารถแยกความแตกต่างได้จากไอคอนผลรวม:

หากคุณต้องการใช้ ข้อมูลเหล่านี้สำหรับบทความหรือบทความภาคการศึกษา - ฉันจะขอบคุณมากสำหรับลิงก์ในรายการแหล่งที่มา คุณจะพบการคำนวณโดยละเอียดในบางแห่ง:

มาสร้างระบบมาตรฐานกันเถอะ:

เราลดสมการแต่ละสมการด้วย "สอง" และนอกจากนี้ "แยกส่วน" ผลรวม:

บันทึก : วิเคราะห์อย่างอิสระว่าทำไมจึงนำ "a" และ "be" ออกจากไอคอนผลรวมได้ อย่างไรก็ตาม อย่างเป็นทางการสามารถทำได้ด้วยผลรวม

มาเขียนระบบใหม่ในรูปแบบ "นำไปใช้":

หลังจากนั้นอัลกอริทึมสำหรับการแก้ปัญหาของเราก็เริ่มถูกวาด:

เรารู้พิกัดของจุดต่างๆ หรือไม่? พวกเรารู้. ผลรวม เราสามารถหา? อย่างง่ายดาย. เราเขียนง่ายที่สุด ระบบสมการเชิงเส้นสองสมการที่มีค่านิรนามสองตัว("a" และ "beh") เราแก้ระบบ เช่น วิธีการของแครมเมอร์ทำให้เกิดจุดคงที่ กำลังตรวจสอบ สภาพที่เพียงพอสำหรับสุดขั้วเราสามารถยืนยันได้ว่า ณ จุดนี้ฟังก์ชั่น ถึงแม่นๆ ขั้นต่ำ. การยืนยันเกี่ยวข้องกับการคำนวณเพิ่มเติม ดังนั้น เราจะทิ้งมันไว้เบื้องหลัง (ถ้าจำเป็นสามารถดูเฟรมที่หายไปได้). เราสรุปผลสุดท้าย:

การทำงาน วิธีที่ดีที่สุด (อย่างน้อยเมื่อเทียบกับฟังก์ชันเชิงเส้นอื่นๆ)นำจุดทดลองมาใกล้มากขึ้น . กล่าวโดยคร่าว ๆ กราฟของมันผ่านเข้าไปใกล้จุดเหล่านี้มากที่สุด ตามประเพณี เศรษฐมิติฟังก์ชันการประมาณผลลัพธ์เรียกอีกอย่างว่า สมการถดถอยเชิงเส้นคู่ .

ปัญหาที่กำลังพิจารณามีความสำคัญในทางปฏิบัติอย่างมาก ในสถานการณ์ด้วยตัวอย่างของเรา สมการ ให้คุณทำนายว่าจะมีผลประกอบการแบบไหน ("ยิ๊ก")จะอยู่ที่ร้านค้าด้วยมูลค่าของพื้นที่ขายอย่างใดอย่างหนึ่ง (ความหมายอย่างใดอย่างหนึ่งของ "x"). ใช่ การคาดการณ์ผลลัพธ์จะเป็นเพียงการคาดการณ์ แต่ในหลายกรณี กลับกลายเป็นว่าแม่นยำทีเดียว

ฉันจะวิเคราะห์ปัญหาเดียวกับตัวเลข "ของจริง" เนื่องจากไม่มีปัญหา - การคำนวณทั้งหมดอยู่ที่ระดับ หลักสูตรโรงเรียนเกรด 7-8 ใน 95 เปอร์เซ็นต์ของกรณี คุณจะถูกขอให้ค้นหาแค่ฟังก์ชันเชิงเส้นตรง แต่ในตอนท้ายของบทความ ฉันจะแสดงให้เห็นว่าการหาสมการของไฮเพอร์โบลาที่เหมาะสมที่สุด เลขชี้กำลัง และฟังก์ชันอื่นๆ นั้นไม่ใช่เรื่องยากอีกต่อไป

ในความเป็นจริง มันยังคงแจกจ่ายสารพัดที่สัญญาไว้ - เพื่อให้คุณได้เรียนรู้วิธีแก้ไขตัวอย่างดังกล่าว ไม่เพียงแต่แม่นยำเท่านั้น แต่ยังรวดเร็วอีกด้วย เราศึกษามาตรฐานอย่างรอบคอบ:

งาน

จากการศึกษาความสัมพันธ์ระหว่างตัวบ่งชี้สองตัว ได้ตัวเลขคู่ต่อไปนี้:

ใช้วิธีกำลังสองน้อยที่สุด หาฟังก์ชันเชิงเส้นที่ใกล้เคียงกับค่าเชิงประจักษ์มากที่สุด (มีประสบการณ์)ข้อมูล. สร้างภาพวาดในระบบพิกัดสี่เหลี่ยมคาร์ทีเซียน พล็อตจุดทดลองและกราฟของฟังก์ชันการประมาณ . หาผลรวมของค่าเบี่ยงเบนกำลังสองระหว่างค่าเชิงประจักษ์และค่าทางทฤษฎี ค้นหาว่าฟังก์ชั่นดีกว่าหรือไม่ (ในแง่ของวิธีกำลังสองน้อยที่สุด)จุดทดลองโดยประมาณ

โปรดทราบว่าค่า "x" เป็นค่าธรรมชาติและสิ่งนี้มีความหมายที่มีความหมายซึ่งฉันจะพูดถึงในภายหลัง แต่แน่นอนว่าสามารถเป็นเศษส่วนได้ นอกจากนี้ ขึ้นอยู่กับเนื้อหาของงานเฉพาะ ค่าทั้ง "X" และ "G" สามารถเป็นค่าลบทั้งหมดหรือบางส่วนได้ เราได้รับภารกิจ "ไร้หน้า" และเริ่มทำ สารละลาย:

เราพบค่าสัมประสิทธิ์ของฟังก์ชันที่เหมาะสมที่สุดเพื่อแก้ปัญหาระบบ:

สำหรับวัตถุประสงค์ของสัญกรณ์ที่กระชับมากขึ้น คุณสามารถละเว้นตัวแปร "ตัวนับ" ได้ เนื่องจากเป็นที่แน่ชัดแล้วว่าการบวกดำเนินการตั้งแต่ 1 ถึง .

สะดวกกว่าในการคำนวณจำนวนเงินที่ต้องการในรูปแบบตาราง:


การคำนวณสามารถทำได้บนไมโครเครื่องคิดเลข แต่จะดีกว่ามากถ้าใช้ Excel - ทั้งเร็วกว่าและไม่มีข้อผิดพลาด ดูวิดีโอสั้น ๆ :

ดังนั้นเราจึงได้ค่าต่อไปนี้ ระบบ:

ที่นี่คุณสามารถคูณสมการที่สองด้วย 3 และ ลบที่ 2 จากเทอมสมการที่ 1 ด้วยเทอม. แต่นี่คือโชค - ในทางปฏิบัติ ระบบมักไม่มีของกำนัล และในกรณีเช่นนี้ จะช่วยประหยัด วิธีการของแครมเมอร์:
ดังนั้นระบบจึงมีโซลูชันที่ไม่เหมือนใคร

มาทำเช็คกัน ฉันเข้าใจว่าฉันไม่ต้องการ แต่ทำไมข้ามข้อผิดพลาดที่คุณไม่พลาดอย่างแน่นอน แทนที่คำตอบที่พบในด้านซ้ายของแต่ละสมการของระบบ:

ได้ส่วนที่ถูกต้องของสมการที่สอดคล้องกัน ซึ่งหมายความว่าระบบได้รับการแก้ไขอย่างถูกต้อง

ดังนั้น ฟังก์ชันการประมาณที่ต้องการ: – from ฟังก์ชันเชิงเส้นทั้งหมดข้อมูลการทดลองจะประมาณค่าได้ดีที่สุด

ไม่เหมือน ตรง การพึ่งพาการหมุนเวียนของร้านค้าในพื้นที่ การพึ่งพาที่พบคือ ย้อนกลับ (หลักการ ยิ่งมาก ยิ่งน้อย”)และความจริงข้อนี้จะถูกเปิดเผยทันทีโดยแง่ลบ สัมประสิทธิ์เชิงมุม. การทำงาน แจ้งให้เราทราบว่าเมื่อตัวบ่งชี้เพิ่มขึ้น 1 หน่วย ค่าของตัวบ่งชี้ที่ขึ้นต่อกันจะลดลง เฉลี่ย 0.65 หน่วย อย่างที่พวกเขาพูดกันว่ายิ่งราคาบัควีทสูงเท่าไหร่ก็ยิ่งขายได้น้อยลงเท่านั้น

ในการพล็อตฟังก์ชันการประมาณ เราพบค่าสองค่า:

และดำเนินการวาด:


เส้นที่สร้างขึ้นเรียกว่า เส้นแนวโน้ม (กล่าวคือ เส้นแนวโน้มเชิงเส้น คือ ใน กรณีทั่วไปแนวโน้มไม่จำเป็นต้องเป็นเส้นตรง). ทุกคนคุ้นเคยกับสำนวนที่ว่า "to be in trend" และฉันคิดว่าคำนี้ไม่ต้องการความคิดเห็นเพิ่มเติม

คำนวณผลรวมของส่วนเบี่ยงเบนกำลังสอง ระหว่างค่าเชิงประจักษ์และเชิงทฤษฎี ในเชิงเรขาคณิต นี่คือผลรวมของกำลังสองของความยาวของส่วน "สีแดงเข้ม" (สองอันเล็กจนมองไม่เห็น).

มาสรุปการคำนวณในตารางกัน:


สามารถดำเนินการได้ด้วยตนเองอีกครั้ง ในกรณีที่ฉันจะยกตัวอย่างสำหรับจุดที่ 1:

แต่มันมีประสิทธิภาพมากกว่าที่จะทำวิธีที่รู้อยู่แล้ว:

มาทำซ้ำ: ความหมายของผลลัพธ์คืออะไร?จาก ฟังก์ชันเชิงเส้นทั้งหมดการทำงาน เลขชี้กำลังที่เล็กที่สุดนั่นคือมันเป็นค่าประมาณที่ดีที่สุดในตระกูล และอย่างไรก็ตาม คำถามสุดท้ายของปัญหาไม่ได้เกิดขึ้นโดยบังเอิญ ถ้าฟังก์ชันเลขชี้กำลังที่เสนอมาจะเป็นอย่างไร จะดีกว่าไหมถ้าจะประมาณจุดทดลอง?

มาหาผลรวมของค่าเบี่ยงเบนกำลังสองที่ตรงกัน - เพื่อแยกความแตกต่าง ฉันจะกำหนดพวกมันด้วยตัวอักษร "epsilon" เทคนิคเหมือนกันทุกประการ:


และอีกครั้งสำหรับการคำนวณไฟทุกครั้งสำหรับจุดที่ 1:

ใน Excel เราใช้ฟังก์ชันมาตรฐาน EXP (ไวยากรณ์สามารถพบได้ในวิธีใช้ Excel).

เอาท์พุต: ดังนั้นฟังก์ชันเลขชี้กำลังจะประมาณจุดทดลองที่แย่กว่าเส้นตรง .

แต่ควรสังเกตตรงนี้ว่า "แย่กว่า" คือ ไม่ได้หมายความว่ายัง, เกิดอะไรขึ้น. ตอนนี้ฉันสร้างกราฟของฟังก์ชันเลขชี้กำลัง - และมันก็ส่งผ่านใกล้กับจุด - มากเสียจนไม่มีการศึกษาเชิงวิเคราะห์ เป็นการยากที่จะบอกว่าฟังก์ชันใดแม่นยำกว่า

วิธีนี้ทำให้การแก้ปัญหาเสร็จสมบูรณ์ และฉันกลับไปที่คำถามเกี่ยวกับค่าธรรมชาติของการโต้แย้ง ในการศึกษาต่างๆ ตามกฎ เศรษฐกิจหรือสังคมวิทยา เดือน ปี หรือช่วงเวลาที่เท่าเทียมกันอื่นๆ จะถูกนับด้วย "X" ตามธรรมชาติ ยกตัวอย่างปัญหาดังกล่าว



บทความที่คล้ายกัน
 
หมวดหมู่