请帮忙!我不知道如何在训练神经网络时使用线性回归。我将使用书中的材料 - Robert Callan, Essence of Neural Networks。
第1部分 :
我们在图(点)上有 x 和 y。
为了从我们得到的结果中为我们预测 y,我们需要建立一条直线 - y = mx + c。也就是这条线,在此期间,点与线之间的距离会最小——也就是说,预测误差更小。
y \u003d mx + c,其中 m 是斜率,c 是位移。
为了找到 m 和 c,我使用以下公式 -
我发现了这样一个直线方程,当代入任何 x 时,我会得到一个几乎真实的 y,即系数 m 和 c。假设我们得到这样一条直线 -
y = 3.25x - 0.25
现在主要问题是:
我可以从这个等式中得到什么,即权重在哪里?
一开始我们应该如何填写图表?
我们对 x 取什么 - 输入层上所有可能的输入?什么样的 y 是这样一个传入输入的期望结果?
如果您能举例说明输入层 - x1 、 x2 和输出层 - y 的 AND 操作的这种方法,那将非常有帮助


对不起,你有粥。我认为,因为对于许多人来说 - 在不了解构建机器学习的基本基础的情况下尝试处理神经网络,只有神经网络是其中的一个特例。
现在回答问题。你有一个回归任务。它可以通过不同的方式解决。您自己已经给出了其中一个 - 您在答案中插入的那些公式是问题的解决方案。没有任何神经网络。您的“权重”是系数 c 和 m。无需填写“日程(!)开头(!!)”。您已经根据可用点建立了方程形式的模型。现在,您可以将任何以前未知的 X 值代入结果公式,并获得因变量 Y 的“预测”值。例如,X=2。那么 Y=6.25。也许这个 X 的 Y 的实际值有些不同,但在选定的模型类别中,您的 Y = 6.25。问题解决了。
但!为了获得用于计算系数的指定公式,首先指定模型误差的度量,在经典情况下 - 作为 Y 的已知值与预测的值之间的差的平方和在相同的点 X 处建立模型。然后建立一个超定方程组,根据系数 c 和 m 求解。正是由于选择了这种措施,该系统才有了一个分析解决方案,您可以以现成公式的形式使用它。
但是,如果您希望使用不同的模型误差度量,或者如果您的 X 点设置在多维空间中,那么找到解决方案并不容易。在这些情况下,唯一剩下的就是使用数值方法来求解方程组,通常是梯度下降的优化方法。神经网络不过是此类方法的“营销包装器”。作为使用这种方法的结果,您已经以系数集的形式获得了回归模型,这些系数以某种复杂的方式将您的多维 X 和一维 Y 连接起来。
当然,在您的情况下,您也可以尝试使用神经网络,但这与甚至不是从大炮而是从火箭射击 - 在麻雀上射击大致相同。您可以找到更详细的描述,例如,here
https://habr.com/post/307004/
因此,回答您的问题,在构建神经网络时不是使用线性回归,而是使用神经网络,他们构建(然后使用)回归(或分类,或聚类等)模型。
是这样的。