AlexNet 源代码发布:AI 时代的里程碑与未来发展

40次阅读
没有评论

共计 1740 个字符,预计需要花费 5 分钟才能阅读完成。

2012 年,AlexNet 的出现标志着人工智能领域的一次重大突破。这个由多伦多大学研究生 Alex Krizhevsky 开发的神经网络,首次展示了计算机在图像识别能力上的巨大飞跃,彻底改变了人工智能的发展轨迹。如今,这一具有历史意义的模型源代码终于向公众开放。

周四,计算机历史博物馆(CHM)与谷歌合作,首次发布了 AlexNet 的源代码,并将其托管在 GitHub 上供所有人浏览和下载。这一举措不仅是对人工智能历史的致敬,也为研究者和开发者提供了宝贵的学习资源。

AlexNet 源代码发布:AI 时代的里程碑与未来发展

“CHM 很荣幸展示 2012 年 Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 的 AlexNet 源代码,它彻底改变了人工智能领域,”博物馆组织者在 GitHub 的 README 文件中写道。

AlexNet 的成功源于其对卷积神经网络(CNN)的创新应用。该模型在 2012 年的 ImageNet 竞赛中以 15.3% 的错误率大幅领先于其他参赛者,展示了深度学习在图像识别任务中的巨大潜力。这一成就不仅验证了深度神经网络的理论,还引发了人工智能领域的大量创新和资本涌入。

AlexNet 的源代码仅占 200KB,结合了 Nvidia CUDA 代码、Python 脚本和少量 C++,描述了如何使卷积神经网络解析和分类图像文件。博物馆的软件历史学家 Hansen Hsu 花了五年时间与拥有源代码版权的谷歌谈判,最终成功发布这一具有历史意义的代码。

“在 AlexNet 之前,几乎所有的领先计算机视觉论文都没有使用神经网络。在那之后,几乎所有论文都使用了,”Meta Platforms 的首席 AI 科学家 Yann LeCun 曾如此评价 AlexNet 的影响。

AlexNet 的成功并非偶然。其背后是三位关键人物的共同努力:Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton。Krizhevsky 是 Hinton 的研究生,而 Sutskever(后来共同创立了 OpenAI)则鼓励 Krizhevsky 继续这一项目。正如 Hsu 引用 Hinton 的话:“Ilya 认为我们应该做,Alex 让它成功了,而我获得了诺贝尔奖。”

谷歌拥有 AlexNet 的知识产权,因为它收购了 Hinton、Krizhevsky 和 Sutskever 的初创公司 DNNResearch。这一收购不仅为谷歌带来了技术优势,也为人工智能领域的进一步发展奠定了基础。

AlexNet 的成功也离不开 ImageNet 数据集的支持。这一由斯坦福大学教授李飞飞创建的庞大图像数据集,为训练大型卷积神经网络提供了必要的数据基础。李飞飞通过亚马逊 Mechanical Turk 众包工人手工标记了 1400 万张图像,这一数据集比当时任何计算机视觉数据集都要大得多。

“这似乎是一个难以置信的困难数据集,但很明显,如果我们能在这个数据集上训练一个大型卷积神经网络,只要我们拥有足够的计算能力,它就一定会成功,”Sutskever 在 2023 年与 Nvidia 联合创始人兼 CEO Jensen Huang 的炉边谈话中如此说道。

AlexNet 的成功证明了通过更多层神经元构建“深度”神经网络的理论可行性,展示了它们确实可以学习模式。这一突破为后续的 AI 发展铺平了道路,从合成人类声音到击败围棋冠军,再到生成艺术作品,深度神经网络的应用范围不断扩大。

2022 年,Sutskever 共同创立的 OpenAI 发布了 ChatGPT,再次证明了大型神经网络的潜力。ChatGPT 的出现是之前所有 GPT 1、2 和 3 模型的结果,这些模型都是 Sutskever 对将神经网络扩展到前所未有规模的信念的成果。

“我非常坚信越大越好,我们在 OpenAI 的目标之一就是弄清楚如何正确使用规模,”Sutskever 在 2023 年告诉 Huang。

AlexNet 源代码的发布恰逢 AI 领域对另一个开源模型 DeepSeek AI 的 R1 着迷之际。这一时机的巧合不仅展示了 AI 技术的持续进步,也为未来的创新提供了更多可能性。

AlexNet 的发布不仅是人工智能历史的一次回顾,更是对未来发展的展望。正如 Hsu 所写:“AlexNet 只是一个开始。在接下来的十年里,神经网络将发展到合成可信的人类声音、击败围棋冠军、模拟人类语言并生成艺术作品。”

正文完
 0
admin-gah
版权声明:本文于2025-03-21转载自Zdnet,共计1740字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码