我们可以把学习过程看作一个在所有假设组成的空间中进行搜索的过程,搜索目标是找到与训练集"匹配" 的假设,即能够将训练集中的瓜判断正确的假设.假设的表示一旦确定,假设空间及其规模大小就确定了.
对于西瓜问题,这里我们的假设空间由形如"(色泽=?)^(根蒂=?) ^ (敲声=?)"的可能取值所形成的假设组成.
例如色泽有"青绿" "乌黑" "浅白"这三种可能取值;
还需考虑到,也许"色泽"无论取什么值都合适,我们用通符"*"来表示,例如"好瓜件(色泽= *) ^ (根蒂口蜷缩)八(敲声=浊响)" ,即"好瓜是根蒂蜷缩、敲声浊响的瓜,什么色泽都行"
此外,还需考虑极端情况:有可能"好瓜"这个概念根本就不成立,世界上没有"好瓜"这种东西;我们用∅表示这个假设.
这样,若"色泽" "根蒂" "敲声"分别有 3,3,2种可能取值,则我们面临的假设空间规模大小为4 x 3 x 3 + 1 = 37
(4,3,3分别代表"色泽" "根蒂" "敲声"的取值,除特征取值外,还可以取“*”,最后的1代表∅,即不存在好瓜)