关于我在填报志愿时使用的妙法

收集数据

要知道要想分析，首先应该有数据，你可以在百度或者其他搜索引擎上搜索到高考相关信息，非常便捷，一般在填报志愿时一本分数线都会知道，不知道也没关系，无非是少了一份数据。

这里我以黑龙江5年内一本分数线举例，我们先定义出我们的数组：

import matplotlib.pyplot as plt
from pylab import *
from scipy.optimize import leastsq
import numpy as np
# 年份
data = np.array([2018,2019,2020,2021])
data2 = np.array([2017,2018,2019,2020,2021])
# 目标学校录取分数（专业线或者投档线都可以）
score = np.array([500,514,500,455])
# 一本线
line = np.array([455,472,477,455,415])

# 如果出现了当年的一本线,则补全
lline = np.array([455,472,477,455,415,429])
# 年份
ldata = np.array([2017,2018,2019,2020,2021,2022])

绘制图像

收集完分数后我们先绘制一下学校录取线关于年份的散点图：

if __name__ == '__main__':
    plt.figure(figsize=(8,6))
    # 如果你不知道一本线可以绘制一本线的图形
    [[plt]].scatter(data, line, color="green", label="Data analysis", linewidth=2)
    plt.scatter(data, score, color="green", label="Data analysis", linewidth=2)
    plt.xlim(2017,2022)
    plt.show()

我们看到散点的走势先增后减，所以我们要用二次函数去拟合它，我们选择使用最小二乘法求参数，所以我们先抽象出函数的形式。

抽象函数我们需要使用一个能直接返回函数值的python函数和计算参数的函数

# 计算值的函数
def norfun(params,x):
    a,b,c=params
    return a*x*x+b*x+c

def error(params,x,y):
    return norfun(params,x)-y

# 计算参数的函数
def sloveParam():
    p0 = [10, 10, 10]
    # Param计算出了data为x、score为y的二次函数拟合参数
    Param = leastsq(error, p0, args=(data, score))
    return Param

然后我们在main函数内加入二次函数，绘制出拟合曲线：

if __name__ == '__main__':
    Param = sloveParam()
    a, b, c = Param[0]
    print("y="+str(round(a,2))+"x*x+"+str(round(b,2))+"x+"+str(c))

    plt.figure(figsize=(8,6))
    plt.scatter(data, score, color="green", label="Data analysis", linewidth=2)
    plt.xlim(2017,2022)
    ## plt.ylim(400,550)

    x=np.linspace(2017,2022,100) ##在2017-2022这15年间直接画100个点,也可以向后修改年份
    y=a*x*x+b*x+c ##函数式
    plt.plot(x,y,"ro-")
    plt.legend()
    plt.show()

我们看一下拟合曲线可以发现，拟合效果非常好，可以我们看到右下角我们要预测的值很离谱，只有380.8是不是意味着我们稳了呢？并不是，其实是我们在计算拟合曲线出错了，原因很简单，我们没有加入所有影响数据的变量，最重要的就是变量line，因为它的波动直接影响了拟合曲线，所以我们要使用的纵轴值应该时score-line。

结论与源码

最后我们把成品代码发一下，绘制出差值拟合图，最后我们得到学校和一本线的差距是多少

import matplotlib.pyplot as plt
from pylab import *
from scipy.optimize import leastsq
import numpy as np

# 年份
data = np.array([2018,2019,2020,2021])
data2 = np.array([2017,2018,2019,2020,2021])
# 目标学校录取分数（专业线或者投档线都可以）
score = np.array([500,514,500,455])
# 一本线
line = np.array([455,472,477,455,415])

# 如果出现了当年的一本线,则补全
lline = np.array([455,472,477,455,415,429])
# 年份
ldata = np.array([2017,2018,2019,2020,2021,2022])

# 计算值的函数
def norfun(params,x):
    a,b,c=params
    return a*x*x+b*x+c

def error(params,x,y):
    return norfun(params,x)-y

# 计算参数的函数
def sloveParam():
    p0 = [10, 10, 10]
    # Param计算出了data为x、score为y的二次函数拟合参数
    Param = leastsq(error, p0, args=(data, score))
    return Param

if __name__ == '__main__':
    Param = sloveParam()
    a, b, c = Param[0]
    print("y="+str(round(a,2))+"x*x+"+str(round(b,2))+"x+"+str(c))

    plt.figure(figsize=(8,6))
    plt.scatter(data, score-line, color="green", label="Data analysis", linewidth=2)
    plt.xlim(2017,2022)
    ## plt.ylim(400,550)

    x=np.linspace(2017,2022,100) ##在2017-2022这15年间直接画100个点,也可以向后修改年份
    y=a*x*x+b*x+c
    plt.plot(x,y,"ro-")
    plt.legend()
    plt.show()