科技

ShareGPT4V作者团队又一力作！百万高质量视频

继Sora官宣之后，多模态大模型在视频生成方面的应用简直就像井喷一样涌现出来，LUMA、Gen，3Alpha等视频生成模型展现了极佳质量的艺术风格和视频场景的细节雕刻能力，文生视频、图生视频的新前沿不断被扩展令大家惊喜不已，抱有期待，最近，来自中国科学技术大学、北京大学、上海AILab等团队的研究人...

2024-11-14 496

科技

AI新思考的草莓模型浴火重生

这个模型肯定比我更擅长解决AP数学考试，而且我在大学时辅修数学，，OpenAI的首席研究官鲍勃·麦格鲁，BobMcGrew，告诉我，他说，OpenAI还根据国际数学奥林匹克竞赛的资格考试对o1进行了测试，虽然GPT，4o只正确解决了13%的问题，但o1的得分为83%，OpenAI发布名为o1新模型，...

2024-11-14 759

数码资讯

NVIDIA ViT篇外 Llama

大家也许会很好奇为什么在ViT章节插入了NVIDIALlama，3.1，Minitron4B，ViT因为应用场景的特殊性所以都寄希望于高效率的模型，因此各种针对大参数模型的提炼和优化技术层出不穷，而NVIDIALlama，3.1，Minitron则复现了这些系列的教科书实验，对于一些基本的术语，可以...

2024-11-14 461

数码资讯

引入数学主题树基准来全面评估LLMs LLMs并非智能思考者

摘要，大型语言模型，LLMs，在数学推理方面展示了令人印象深刻的能力，然而，尽管取得了这些成就，当前的评估主要限于特定的数学主题，尚不清楚LLMs是否真正参与了推理，为了解决这些问题，我们提出了数学主题树，MaTT，基准，一个具有挑战性和结构化的基准，涵盖了广泛的数学科目，提供了1958个问题，每个...

2024-11-14 949

数码资讯

期刊自然上海交通大学与上海人工智能研究所联合推出医学多语言模型

随着大型语言模型，LLMs，的快速发展，医学领域的应用也取得了显著进展，但是大多数现有的医学语言模型主要集中在英语语言环境中，限制了其在非英语国家和地区的应用潜力，为了填补这一空白，来自上海交大和上海人工智能实验室的研究团队研发了一个开源的、多语言的医学语言模型，旨在为全球多语言用户提供高质量的医学...

2024-11-14 734

科技

Agent四大范式

什么是智能体AgentAutonomousagents又被称为智能体Agent，能够通过感知周围环境、进行规划以及执行动作来完成既定任务，在这些能力中，规划尤为重要，它涉及到复杂的理解、推理和决策制定，大语言模型出现以前，我们一般通过规则的方法，或者强化学习的方法来实现，但是这两种方法各有弊端，近几...

2024-11-14 538

科技

五个简单好用的本地运行大模型的方法

出品，技术栈，微信号，blog51cto，像ChatGPT、Claude.ai和phind这样的聊天机器人非常有用，但可能并不总是希望的问题或敏感数据由外部应用程序处理，在平台上尤其如此，在这些平台上，你的互动可能会被人类审查，并以其他方式用于帮助训练未来的模型，一种解决方案是下载一个大型语言模型，...

2024-11-14 413

数码资讯

AI新动能数字人三大特征八大场景

随着元宇宙概念的火爆也一同带动了数字人市场的快速升温，据计算全球平均每天都会诞生一个数字人，数字人正成为一股潮流，涌入人们的日常生活——会，捉妖，的虚拟美妆达人柳夜熙，抖音出道三天点赞即超百万，一夜之间成为国内虚拟偶像界的，顶流，；在江苏卫视跨年演唱会上，昔日歌后邓丽君，重返，舞台，与歌手周深同台对...

2024-11-14 811

科技

有哪些特征类型什么是生成式AI

生成式AI是人类一种人工智能技术，可以生成各种类型的内容，包括文本、图像、音频和合成数据，那么什么是人工智能，人工智能和机器学习之间的区别是什么，有哪些技术特征，人工智能是一门学科，是计算机科学的一个分支，研究智能代理的创建，这些智能代理是可以推理、学习和自主行动的系统，从本质上讲，人工智能与构建像...

2024-11-14 363

数码资讯

一文彻底搞懂GPT

GPT，3是一个具有1750亿个参数的自回归语言模型，比任何以前的非稀疏语言模型多10倍，对于所有任务，GPT，3均无需任何梯度更新或微调即可应用，任务和少样本演示完全通过与模型的文本交互来指定，可以生成新闻文章样本，而人类评估者很难将这些样本与人类撰写的文章区分开来，接下来分为四部分，摘要、引言、...

2024-11-14 905

数码资讯

Transformer动画讲解

一、GPT的核心是TransformerGPT，GenerativePre，trainedTransformer，是一种基于单向Transformer解码器的预训练语言模型，它通过在大规模语料库上的无监督学习来捕捉语言的统计规律，从而具备强大的文本生成能力，在GPT，GenerativePre，tr...

2024-11-14 478

科技

Arcee AI发布SuperNova 超级新星降临

01引言在人工智能，AI，的世界里，大型语言模型已经成为解决复杂任务、提升决策过程的重要工具，但这些模型的扩展也带来了高计算成本、低可访问性和环境影响等挑战，ArceeAI直面这些挑战，推出了SuperNova，Medius——一款旨在保持大型模型高质量输出的同时，克服其局限性的小语言模型，02Su...

2024-11-14 400

科技

利用agent自动生成论文idea 再也不用担心做科研没有思路了 ResearchAgent

大家好，我是HxShine今天分享微软的一篇文章，ResearchAgent，IterativeResearchIdeaGenerationoverScientificLiteraturewithLargeLanguageModels，传统的科学研究过程包括新研究想法的提出和通过精心设计的实验来验证...

2024-11-14 519

数码资讯

Thought TOT of Tree

今天分享一篇普林斯顿大学的一篇文章，TreeofThoughts，DeliberateProblemSolvingwithLargeLanguageModels[1]，思维之树，用大型语言模型解决复杂问题，这篇工作还是非常有借鉴意义的，OpenAI的AndrejKarpathy，前TeslaAI高级...

2024-11-14 896

数码资讯

利用LLM本身训练SoTA Microsoft embedding模型

大家好，我是HxShine今天分享一篇Microsoft公司的一篇文章，Title，ImprovingTextEmbeddingswithLargeLanguageModels，使用大型语言模型改善文本嵌入，这篇文章探索了直接利用LLM来做embedding模型，其只需要利用合成数据和少于1000次...

2024-11-14 675

科技

联系我们