所以它仍然是由人类标注的只不过这种标注是隐式的而不是显式的。习任务受到更多限制。我们必须设计出一套我们想要发现的概念本体论。 比如在 中和她的学生们花了很多时间思考 挑战赛中的一千个类别应该是什么。
而在同时期的其他数据集如用于目标检测的数 哥斯达黎加 WhatsApp 号码列表 据集他们也花了很多心思去决定放入哪些个类别。 那么让我们谈谈生成式 。当我攻读博士学位的时候在你们出现之前我上过 w 的机器学习课程还学过 h K 非常复杂的贝叶斯课程对我来说这些都很复杂。
当时的很多内容都是预测建模。我还记得 你解锁了整个视觉领域的东西但是生成式 大约是在过去四年中才出现的。
这对我来说是一个完全不同的领域——你不再是识别物体也不是在预测什么而是在生成新的东西。
所以也许我们可以谈谈是什么关键因素让生成式 得以实现它和之前的不同之处以及我们是否应该以不同的方式去看待它它是否是一个连续发展的部分还是另一个全新的领域? 这非常有趣即使在我研究生时代生成模型就已经存在了。
我们当时就想做生成只不过没人记得了即使是用字母和数字做生成我们也在尝试一些事情。 J H 当时有一些关于生成的论文我们也在思考如何生成。 实际上如果你从概率分布的角度来看数学上是可以进行生成的只是当时生成的东西根本无法让人感到惊艳。