OpenAI_第12页_坚曼百货商行

思维可视化提示激发大语言模型空间推理能力

引言最近，大语言模型，LLMs，在各种与语言相关的任务上取得了显著的表现，然而，尽管它们在数学推理、常识推理以及其他推理任务，如符号推理或逻辑推理等方面取得了成功，但它们在空间推理方面的能力仍然未被充分探索，空间推理是人类认知的基本功能，使我们能够与环境互动，它促进了需要理解和推理物体及其运动之间空...

2024-11-15 301

百货

回归预测模型

前言本文基于Kaggle平台——洪水数据集的回归预测，文末附数据集，，介绍一种基于CNN，LSTM网络的回归预测模型，以下是数据集中各列的描述，包括功能名称的含义，MonsoonIntensity，季风强度，这一特征可能衡量该地区季风降雨的强度和频率，较高的值表示降雨强度更大，可能更频繁，这可能会导...

2024-11-15 563

新闻资讯

时间序列预测 NLP大模型新作为时序预测自动生成隐式Prompt

今天给大家介绍一篇最新的大模型，时间序列预测工作，由康涅狄格大学发表，提出了一种将时间序列在隐空间和NLP大模型对齐，并利用隐空间prompt提升时间序列预测效果的方法，论文标题，S2IP，LLM，SemanticSpaceInformedPromptLearningwithLLMforTimeSe...

2024-11-15 799

科技

多步预测系列

前言本文基于前期介绍的电力变压器，介绍一种基于CNN，LSTM网络的多步预测模型，1、电力变压器数据预处理与可视化1.1导入数据1.2多步预测预处理2、基于CNN，LSTM的多步预测模型2.1定义CNN，LSTM网络模型2.2设置参数，训练模型50个epoch，MSE为0.000311，CNN，LS...

2024-11-15 737

玩具模型

API可视化测试新体验 AI研发革命

当独立的API相互连接时，它们变得极为强大，无论是与外部客户的互动、内部使用还是常规的端到端测试，几乎所有的在线交互实际上都是由相互连接的API网络构成的，流程，这种相互连接是数字产品体验的核心，与API的强大能力相提并论，大型语言模型，LLMs，展现出了令人瞩目的推理能力，它们在解决问题时的迭代思...

2024-11-15 554

玩具模型

打破大模型与代码库的壁垒阿里巴巴提出CODEXGRAPH 引领软件工程新革命

在现代软件工程中，大型语言模型，LLMs，在处理独立的代码任务方面表现出色，例如HumanEval和MBPP，但在处理整个代码库时却遇到了困难，这一挑战促使研究人员探索在代码库规模上增强LLM与代码库的交互，目前的解决方案依赖于基于相似性的检索或手动工具和API，每种方法都有明显的缺点，基于相似性的...

2024-11-15 998

包包服装

LLM新巅峰

本文提出了mllm，NPU，这是第一个有效利用设备上神经处理单元，NPU，卸载的LLM推理系统，mllm，NPU的主要设计目标是减少预填充延迟和能耗，它针对主流的仅解码器的变压器架构的LLM，例如LlaMA、GPT等，关键思想是最大限度地在移动NPU上执行预填充，以加速整数计算，同时保持在CPU，G...

2024-11-15 308

包包服装

SkyScript AI编剧时代来临

引言，探索短剧剧本生成的新时代随着人工智能技术的飞速发展，短剧剧本生成领域也迎来了前所未有的变革，传统的剧本创作过程中，编剧需要投入大量的时间和精力来构思情节、设计角色和编写对白，然而，最新的研究成果表明，借助先进的大型语言模型，LLM，，这一过程可以得到极大的简化和加速，SkyworkAI与华中科...

2024-11-15 857

饰品装饰

大模型真能模拟人类语言中国人民大学提出新的数据增强方法

论文标题，LLM，GeneratedNaturalLanguageMeetsScalingLaws，NewExplorationsand&gt，机构，论文链接，https，arxiv.org，pdf，2407.00322.pdf在人工智能领域，大型语言模型，LLM，如GPT，4的出现...

2024-11-15 567

娱乐八卦

字节跳动发布统一多模态大模型 Show

引言，多模态理解与生成的新篇章在人工智能的发展历程中，多模态理解与生成一直是研究的热点领域，随着技术的进步，从单一模态到多模态的转变，使得机器能够更全面地理解和生成信息，极大地拓宽了人工智能的应用范围，本文介绍的研究成果，展示了如何通过一个统一的Transformer模型——Show，o，来实现对多...

2024-11-15 724

母婴用品

多智能体新进展

本文提出了一种名为，HypotheticalMinds，的模型，该模型结合了大语言模型和多智能体强化学习，通过在自然语言处理的框架下生成、评估和细化关于其他智能体策略的假设，来提高智能体在多智能体环境中的表现，该模型在多种竞争性、合作性和混合动机的多智能体环境中均显示出优越的性能，特别是在处理隐藏信...

2024-11-15 695

百货快讯

全面分析揭示大模型中RAG噪声的作用清华大学揭露RAG的双面性

引言，RAG技术与大型语言模型中的噪声问题在大型语言模型，LLMs，的研究与应用中，噪声问题一直是一个不容忽视的挑战，这些模型在处理复杂的语言理解和生成任务时，往往需要从海量的数据中提取有用信息，然而，互联网上充斥着各种非标准的噪声信息，如AI生成的虚假新闻、过时内容、拼写错误等，这些噪声可能会影响...

2024-11-15 164

新闻资讯

微软提出LLM

大型语言模型，LLM，在系统级优化中的新进展近年来，大型语言模型，LLM，在解决复杂问题的推理能力方面取得了显著进展，使其能够有效管理数千种工具和API调用，这些改进释放了它们在大规模系统中的潜力，包括UI，网络界面、移动应用程序、SQL后端和远程感应平台，这些用途通过需要集成各种API来加载、过滤...

2024-11-15 685

行业热门

打破视觉

引言，探索视觉，语言对比预训练中的噪声和低质量标注问题在视觉，语言对比预训练中，噪声和标注质量被认为是影响训练效果的重要因素，本文通过深入研究和分析训练过程中的两个主要问题——错误的负样本对分配和低质量及多样性不足的标注——揭示了通过解决这些问题来提高训练质量的潜力尚未被完全实现，首先，我们研究了影...

2024-11-15 812

生活资讯

提出创新的合成持续预训练方法斯坦福大学研究团队破解小规模语料库知识获取难题

引言，探索小规模语料库中的知识获取在现代的自然语言处理领域，大规模预训练模型已经显示出了在各种知识密集型任务中的卓越性能，这些模型通常依赖于大量的、结构化不强的互联网文本数据进行训练，从而获取丰富的世界知识，然而，这种知识获取方式存在一个明显的问题，数据效率低下，为了学习特定的事实，模型必须在成百上...

2024-11-15 714

包含"OpenAI"标签的文章