Y=β+β1∗X
ใน post นี้ ผมจะใช้ Linear Regression โดยใช้ Advertise data (ISL book chapter3) ในการสร้าง Model (สมการเชิงเส้น) เพื่อคาดการ์ณ ยอดขายจากยอดใช้จ่ายสื่อบนวิทยุ โทรทัศน์ และหนังสือพิมพ์ โดยสมการหรือโมเดลที่คาดว่าจะได้คือ
Sales=β+β1∗TV+β2∗Radio+β3∗Newspaper
โดยตัว model ในขณะสร้าง จะพยายามหาค่า β0...βn เพื่อลดค่า Error ให้ได้มากที่สุด หรือกล่าวอีกในนึงคือยอดขายที่คาดการ์ณกับยอดขายจริงต้องใกล้เคียงกันให้มากที่สุด ซึ่งวิธีการที่นิยมที่สุดเรียกว่า Lease Square criterionเราจะใช้ DataSci iterative process ดังนี้
- Understanding and defining problem
- Understanding data via exploratory data analysis (EDA)
- Data Preparation: Data cleansing & Handling missing value
- Build model
- Evaluate model
ติดตามได้ที Click
No comments:
Post a Comment