-->
CS25是斯坦福大学提供的一门课程,主要探讨深度学习模型Transformers,该模型在全球范围内产生了巨大影响。课程邀请了Transformers研究领域的前沿人物,讨论从GPT和Gemini等LLM架构到创造性应用(如DALL-E和Sora)在内的最新突破。CS25已经成为斯坦福最热门和最令人兴奋的研讨会课程之一。
斯坦福大学的CS25课程,专注于深度学习模型Transformers
学生通过参加CS25课程,深入了解Transformers模型的应用和研究进展
研究人员利用课程提供的资源和讲座,拓展自己的研究领域
公众通过观看Zoom直播和课程录像,提升对人工智能最新发展的了解
发现更多类似的优质AI工具
MegaTTS 3 是由字节跳动开发的一款基于 PyTorch 的高效语音合成模型,具有超高质量的语音克隆能力。其轻量级架构只包含 0.45B 参数,支持中英文及代码切换,能够根据输入文本生成自然流畅的语音,广泛应用于学术研究和技术开发。
QVQ-Max 是 Qwen 团队推出的视觉推理模型,能够理解和分析图像及视频内容,提供解决方案。它不仅限于文本输入,更能够处理复杂的视觉信息。适合需要多模态信息处理的用户,如教育、工作和生活场景。该产品是基于深度学习和计算机视觉技术开发,适用于学生、职场人士和创意工作者。此版本为首发,后续将持续优化。
🤗 AI Agents Course 是由 Hugging Face 提供的免费在线课程,旨在帮助学习者从初学者成长为专家,掌握 AI 智能体的理论、设计和实践。课程内容丰富,涵盖从基础知识到实际应用的多个方面,通过理论学习、实践操作和挑战任务,帮助学习者深入理解 AI 智能体的工作原理,并学会使用最新的库和工具构建自己的智能体。课程还提供认证机会,完成特定任务后可获得证书,适合对 AI 智能体感兴趣的学生和开发者。
Confucius-o1-14B是由网易有道团队开发的推理模型,基于Qwen2.5-14B-Instruct优化而成。它采用两阶段学习策略,能够自动生成推理链,并总结出逐步的问题解决过程。该模型主要面向教育领域,尤其适合K12数学问题的解答,能够帮助用户快速获取正确解题思路和答案。模型具备轻量化的特点,无需量化即可在单个GPU上部署,降低了使用门槛。其推理能力在内部评估中表现出色,为教育领域的AI应用提供了强大的技术支持。
WebWalker是一个由阿里巴巴集团通义实验室开发的多智能体框架,用于评估大型语言模型(LLMs)在网页遍历任务中的表现。该框架通过模拟人类浏览网页的方式,通过探索和评估范式来系统地提取高质量数据。WebWalker的主要优点在于其创新的网页遍历能力,能够深入挖掘多层级信息,弥补了传统搜索引擎在处理复杂问题时的不足。该技术对于提升语言模型在开放域问答中的表现具有重要意义,尤其是在需要多步骤信息检索的场景中。WebWalker的开发旨在推动语言模型在信息检索领域的应用和发展。
SLM_Survey是一个专注于小型语言模型(SLMs)的研究项目,旨在通过调研和测量,提供对这些模型的深入了解和技术评估。该项目涵盖了基于Transformer的、仅解码器的语言模型,参数范围在100M至5B之间。通过对59个最先进的开源SLMs进行调研,分析了它们的技术创新,并在多个领域评估了它们的能力,包括常识推理、上下文学习、数学和编程。此外,还对它们的运行时成本进行了基准测试,包括推理延迟和内存占用。这些研究对于推动SLMs领域的研究具有重要价值。
o1 in Medicine是一个专注于医学领域的人工智能模型,旨在通过先进的语言模型技术,提升医学数据的处理能力和诊断准确性。该模型由UC Santa Cruz、University of Edinburgh和National Institutes of Health的研究人员共同开发,通过在多个医学数据集上的测试,展示了其在医学领域的应用潜力。o1模型的主要优点包括高准确率、多语言支持以及对复杂医学问题的深入理解能力。该模型的开发背景是基于当前医疗领域对于高效、准确的数据处理和分析的需求,尤其是在诊断和治疗建议方面。目前,该模型的研究和应用还处于初步阶段,但其在医学教育和临床实践中的应用前景广阔。
面试通是一款利用AI技术为求职者提供面试辅助的在线工具,通过实时精准识别面试官问题并生成专业回答,帮助用户提高面试成功率。产品背景基于当前求职者在面试准备过程中面临的挑战,如技术问题、行为问题以及压力面试等。面试通通过其AI模型,能够提供即时的、专业的面试答案,帮助用户在面试中表现出色。
DeepLearning.AI 是由著名人工智能专家Andrew Ng创立的在线教育平台,专注于提供机器学习和深度学习领域的高质量课程和专业证书。该平台为初学者和专业人士提供了一个学习AI技能和应用它们的实践机会。通过与行业领导者的合作,DeepLearning.AI 确保了课程内容的前沿性和实用性,帮助学习者在AI领域建立坚实的基础,并推动他们的职业发展。
斑马AI学是斑马儿童科教集团旗下的一款儿童数字内容产品,利用AI技术为儿童提供个性化学习体验。产品通过参与教育部课题研究,拥有500+项知识产权,覆盖口语评测、AI互动等环节,旨在全面培养孩子的核心素养和全方位能力。
Anthropic的交互式教程旨在提供全面的分步指导,教授如何在Claude内构建最优的提示。教程由9章组成,每章都附有练习,以及一个附录,包含更高级的方法。教程使用Anthropic最小的、最快的、最便宜的模型Claude 3 Haiku,还有更智能的Claude 3 Sonnet和Claude 3 Opus模型。教程也存在于使用Anthropic的Claude for Sheets扩展的Google Sheets上,推荐使用该版本,因为它更用户友好。
NuminaMath是一套为训练最先进数学语言模型(SOTA math LLMs)而设计的数据库和模型。它包含860k+数学竞赛问题及其解决方案对,每个解决方案都使用了链式思维(Chain of Thought, CoT)推理进行模板化。此外,还有70k+数学竞赛问题,其解决方案由GPT-4通过工具集成推理(Tool-Integrated Reasoning, TIR)生成。NuminaMath通过提供高质量的数学问题和解决方案,为教育工作者和学生提供了一个宝贵的资源,帮助他们提高数学思维和解决问题的能力。
RWKV 是一种革新的深度学习架构,结合了 RNN 和 Transformer 的最佳特性。它提供出色的性能,快速的推理和训练,并且不依赖自注意力机制,节省 VRAM,支持 ' 无限 ' 的上下文长度。RWKV 在多个语言和编码中表现出色,成为全球开发者的热门选择,推动了开源大语言模型的进步。
AI数学解题器是由数学AI和数学GPT模型(如GPT-4o)驱动的在线工具,旨在提供广泛的数学问题解决方案。它利用先进的人工智能技术,为学生和教师提供详尽的分步解答,增强了对数学概念的理解和解题能力。该产品背景是数学学习中对高效解题工具的需求,定位于免费提供高质量的教育支持。
Eureka Labs 致力于构建一个AI原生的新型学校,通过结合生成式AI技术,提供个性化、高质量的教学辅助,旨在实现教育资源的广泛覆盖和深入学习。其首个产品,LLM101n,是一门引导学生训练自己的AI的本科级课程,类似于AI教学助手的缩小版。课程材料在线可获取,并计划同时运行数字和实体的课程群体。
Study with GPT是一个在线教育平台,利用人工智能技术为用户提供个性化的技术学习方案。该平台能够根据用户的学习目标,设计教程大纲,讲解知识点,并提供24小时在线答疑服务。它主要面向希望提升编程技能的个人用户,特别是初学者和自学者。平台的主要优点包括个性化学习方案、无限耐心的讲解、24小时在线支持,以及无需到处寻找教程资源的便利性。