玩具模型

仅1.3B！Janus 统一多模态理解和生成

Janus是一个统一的多模态理解和生成的大型语言模型，MLLM，，它将多模态理解和生成的视觉编码解耦，Janus基于DeepSeek，LLM，1.3b，base构建，该模型训练时使用了大约5000亿个文本token的语料库，在多模态理解方面，它使用SigLIP，L作为视觉编码器，支持384x384像...

2024-11-15 675

玩具模型

YOLO11问世！重新定义AI的可能性！

YOLO11标志着YOLO家族的新篇章，提供了更强大，更多功能的模型，将计算机视觉带到新的高度，凭借其完善的架构和增强的功能，该模型支持计算机视觉任务，如姿态估计和实例分割，视觉AI社区已经爱上了UltralyticsYOLOv8，但具有更高的性能和精度，Ultralytics创始人兼首席执行官Gl...

2024-11-15 273

玩具模型

一文彻底搞懂多模态

多模态推理多模态推理涉及至少两种不同的感知模态，最常见的是视觉和语言，这两种模态的信息可以是图片和文本、视频和语音等，多模态推理的目标是从不同模态的信息中获取更全面、更准确的理解和知识，以支持各种任务，包括视觉问答、视觉常识推理、视觉语言导航等，接下来分两部分，知识图谱推理、多模态推理任务一起来深入...

2024-11-15 743

玩具模型

大型语言模型 LLM 的历史与未来

大型语言模型，LLM，是现代科技的奇迹，它们的功能复杂，规模庞大，并且具有开创性的进展，本文将探索LLM的历史和未来，一、LLM的起源，NLP和神经网络大型语言模型，LLM，的创建并非一蹴而就，语言模型的第一个概念始于被称为自然语言处理，NLP，的基于规则的系统，这些系统遵循预定义的规则，根据文本...

2024-11-15 746

玩具模型

Chameleon 使用大型语言模型的即插即用组合推理

摘要，大型语言模型，LLMs，在解决各种自然语言处理任务方面取得了显著进展，这归功于其突显的推理能力，然而，LLMs本身存在固有的局限性，例如无法访问最新信息，存储在网络或任务特定的知识库中，、无法使用外部工具，以及无法进行精确的数学和逻辑推理，在本文中，我们提出了变色龙，Chameleon，，一...

2024-11-15 753

玩具模型

一款由知识图谱引擎驱动的创新Agent框架

嘿，大家好！这里是一个专注于AI智能体的频道！今天给大家安利一个开源框架，muAgentv2.0，KG引擎驱动的创新Agent框架，由LLM和EKG，EventicKnowledgeGraph，行业知识载体，驱动的全新Agent框架，协同利用MultiAgent、FunctionCall、CodeI...

2024-11-15 862

玩具模型

用于提取的提示词哪个中文开源大模型在信息抽取上效果最好附

1.背景信息抽取，InformationExtraction，IE，一般包括命名实体识别，NamedEntityRecognition，NER，、关系抽取，RelationExtraction，RE，和事件抽取，EventExtraction，EE，RE则致力于发现实体间的语义联系，比如某人在某地工...

2024-11-15 911

玩具模型

API可视化测试新体验 AI研发革命

当独立的API相互连接时，它们变得极为强大，无论是与外部客户的互动、内部使用还是常规的端到端测试，几乎所有的在线交互实际上都是由相互连接的API网络构成的，流程，这种相互连接是数字产品体验的核心，与API的强大能力相提并论，大型语言模型，LLMs，展现出了令人瞩目的推理能力，它们在解决问题时的迭代思...

2024-11-15 554

玩具模型

打破大模型与代码库的壁垒阿里巴巴提出CODEXGRAPH 引领软件工程新革命

在现代软件工程中，大型语言模型，LLMs，在处理独立的代码任务方面表现出色，例如HumanEval和MBPP，但在处理整个代码库时却遇到了困难，这一挑战促使研究人员探索在代码库规模上增强LLM与代码库的交互，目前的解决方案依赖于基于相似性的检索或手动工具和API，每种方法都有明显的缺点，基于相似性的...

2024-11-15 998

玩具模型

Agent还能这么玩百万上下文RAG

Qwen，Agent的设计思路虽然与LangChain相似，但其发布几个的Agent示例却很有意思，今天本文将深入探讨如何使用Qwen，Agent将上下文记忆扩展到百万量级，让Agent的智能得到更广泛的应用，暴力关键字检索优于向量方案在处理大规模文本数据时，一个关键的挑战是如何快速准确地定位到最...

2024-11-15 779

玩具模型

解锁虚拟现实中的幻觉问题 3D语言模型的新突破

随着人工智能技术的飞速发展，3D语言模型，3D，LLMs，已成为研究的热点，它们在理解和生成语言指令方面展现出了巨大的潜力，这些模型不仅能够处理文本信息，还能理解和操作三维空间中的物体，这对于发展能够与物理世界互动的智能系统至关重要，3D语言模型的核心在于其能够将语言与三维场景紧密结合，传统的大型语...

2024-11-15 766

玩具模型

同时开发团队需警惕上级的过高期望 Gartner预计将有75%的企业程序员使用AI辅助工具到2028年

编译丨诺亚出品，技术栈，微信号，blog51cto，日前，Gartner预测，到2028年，将有75%的企业软件工程师使用AI代码助手，值得一提的是，这一比例在2023年初尚不足10%，根据对598位大型企业软件工程领导者的调查，截至2023年第三季度，已有63%的组织正在试用、部署或已部署了AI代...

2024-11-15 561

玩具模型

ChatGPT无法取代人类程序员！ IEEE 35页论文测出困难编码正确率仅为0.66%

有了ChatGPT，还需要人类程序猿编码吗，上个月，一项发表在IEEETSE期刊，TransactionsonSoftwareEngineering，上的研究评估了ChatGPT所生成的代码在功能性、复杂性和安全性方面的表现，结果显示，ChatGPT生成可用代码的能力差异很大，其成功率从0.66%到...

2024-11-15 467

玩具模型

用于复杂RAG任务的先进可控Agent

一种先进的检索增强型生成，开源解决方案，旨在解决简单的基于语义相似性的检索无法解决的复杂问题，展示了一个复杂的确定性图，作为高度可控的自主的，大脑，，能够回答来自私域数据的复杂问题，关键特性工作流程通过将命名实体替换为变量来匿名化问题，为匿名化的问题生成高层次的计划，去匿名化计划并将其分解为可检索或...

2024-11-15 498

玩具模型

如何高效定制视频扩散模型卡内基梅隆提出VADER 通过奖励梯度进行视频扩散对齐

论文链接，https，arxiv.org，pdf，2407.08737git链接，https，vader，vid.github.io，目前已经在建立基础视频扩散模型方面取得了显著进展，由于这些模型是使用大规模无监督数据进行训练的，因此将这些模型调整到特定的下游任务变得至关重要，通过监督微调来适应这些...

2024-11-15 794

玩具模型

联系我们