|
|
|
|
| '''
|
| Giá trị của R-Squared luôn nằm trong khoảng từ 0 đến 1 (0% đến 100%).
|
|
|
| Giá trị R-Squared cao có nghĩa là nhiều điểm dữ liệu gần với đường hồi quy tuyến tính.
|
| Giá trị R-Squared thấp có nghĩa là đường hồi quy tuyến tính không phù hợp với dữ liệu.
|
| '''
|
|
|
|
|
| '''
|
| Mô hình hồi quy của chúng tôi cho thấy giá trị R-Squared bằng 0, điều này có nghĩa là đường hồi quy tuyến tính không phù hợp với dữ liệu.
|
| Điều này có thể được hình dung khi chúng ta vẽ đồ thị hàm hồi quy tuyến tính thông qua các điểm dữ liệu của Average_Pulse và Calorie_Burnage.
|
| '''
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| import pandas as pd
|
| import matplotlib.pyplot as plt
|
| from scipy import stats
|
|
|
| full_health_data = pd.read_csv('data.csv', header=0, sep=',')
|
| x = full_health_data['Duration']
|
| y = full_health_data['Calorie_Burnage']
|
| slope, intercept, r, p, std_err = stats.linregress(x,y)
|
| def my_function(x):
|
| return slope * x + intercept
|
| mymodel = list(map(my_function,x))
|
| print(mymodel)
|
| plt.scatter(x,y)
|
| plt.plot(x,mymodel)
|
| plt.xlim(xmin=0, xmax=200)
|
| plt.ylim(ymin=0, ymax=2000)
|
| plt.xlabel('Duration')
|
| plt.ylabel('Calorie_Burnage')
|
| plt.title('Regression Table With R-Squared')
|
| plt.show()
|
|
|
|
|
|
|
|
|
|
|
|
|
| '''
|
| Làm thế nào chúng ta có thể tóm tắt hàm hồi quy tuyến tính với Average_Pulse là biến giải thích?
|
|
|
| Hệ số 0,3296, nghĩa là Average_Pulse có tác động rất nhỏ đến Calorie_Burnage.
|
| Giá trị P cao (0,824), nghĩa là chúng ta không thể kết luận mối quan hệ giữa Nhịp tim trung bình và Lượng calo đốt cháy.
|
| Giá trị R-Squared bằng 0, nghĩa là đường hồi quy tuyến tính không phù hợp với dữ liệu.
|
| '''
|
|
|