生活资讯

laws在视觉自回归模型上失效了谷歌联合MIT发布Fluid 文生图质量刷新纪录！ Scaling

文章链接，https，arxiv.org，pdf，2410.13863缩放法则，Scalinglaws，是大语言模型，LLMs，前所未有成功的基础，实证研究表明，在自回归模型中增加参数数量通常会显著提升性能，并在自然语言处理，NLP，任务中产生新的能力，这一实证关系激励了众多扩展语言模型的努力，导致...

2024-11-15 420

生活资讯

普林斯顿大学提出首个基于MoE的稀疏时序预测大模型参数量扩展到2.4billion

今天给大家介绍一篇普林斯顿大学提出的时间序列大模型工作，是首个基于MoE的百万级别参数时间序列大模型，将时序大模型参数量扩展到2.4billion的水平，在多个数据集上取得了显著优于其他时间序列大模型的效果，论文标题，TIME，MOE，BILLION，SCALETIMESERIESFOUNDATIO...

2024-11-15 375

生活资讯

MoE 为什么最新的LLM使用混合专家架构

本文详细介绍了混合专家，MoE，架构，该架构通过混合或融合不同的，专家，模型共同解决特定的问题，专业化的必要性医院有很多具有不同专长的专家和医生，他们擅长解决各自领域内的医疗难题，外科医生、心脏病专家、儿科医生等各类专家紧密合作，为患者提供了全面而个性化的医疗护理服务，同样，人们也可以将这一合作模式...

2024-11-15 871

生活资讯

大型语言模型适配方法详解定制你的AI助手

这是一个由三部分组成的系列博客文章中的第一篇，主题是关于如何适配开源大型语言模型，LLMs，在这篇文章中，我们将探讨适配LLMs到特定领域数据的各种方法，引言大型语言模型，LLMs，在大量语言任务和自然语言处理，NLP，基准测试中展现出了卓越的能力，基于这些通用模型的产品应用正在兴起，在这篇博客文章...

2024-11-15 697

生活资讯

如何评估大语言模型生成结果的多样性

1、论文的背景关于大型语言模型，LLM，的一个开放性问题是，这些模型从预训练数据中学习了哪些模式，以及这些模式是否能够在下游任务和数据集中普遍适用，虽然先前的研究主要集中在生成质量上，最近也开始关注文本生成的新颖性，但对LLM学习到的模式类型的特征描述还很有限，关于评估大型语言模型，LLM，生成文...

2024-11-15 962

生活资讯

微软研究院新突破如何让AI在专业领域更靠谱

01、概述在人工智能的世界里，大型语言模型，LLMs，就像是瑞士军刀，多才多艺，几乎无所不能，但是，当它们遇到需要特定领域知识的任务时，比如医疗保健、法律和金融，这些万能的模型就显得有些力不从心了，这是为什么呢，因为它们在训练时使用的数据集往往缺乏最新的专业信息，导致它们在回答专业问题时可能会，幻觉...

2024-11-15 500

生活资讯

LLM CoT的工作原理

思维链，CoT，ChainofThought，常常作为增强大模型推理能力的利器，但大模型推理能力的提升多大程度上来自人为任务拆解，还是额外提示的Token激发了背后更强大的计算，让我们逐步思考，Transformer语言模型中的隐藏计算，[文献1]发现了一个有趣的现象，通过在思维链中添加无意义的中...

2024-11-15 580

生活资讯

Salesforce等开源1万亿tokens多模态数据集斯坦福

华盛顿大学、斯坦福大学、Salesforce等研究人员联合开源了多模态数据集MINT，1T，据悉，MINT，1T共包含了大约1万亿个文本标记和34亿张图像，是现有开源多模态数据集的10倍，同时还首次从ArXiv网站中爬取了专业论文，进一步提升了数据质量，这对于开源领域开发GPT，4o、Gemini等...

2024-11-15 682

生活资讯

KAN KAN 卷积结合注意力机制！聊聊

第一类基础线性层替换KAN层替换线性层Linear，更新关于LSTM、TCN、Transformer模型中用KAN层替换线性层的故障分类模型，KAN的准确率要优于MLP，我们可以进一步尝试在常规模型的最后一层线性层都替换为KAN层来进行对比；KAN卷积比常规卷积准确率有略微的提升！第二类并行融合模型...

2024-11-15 876

生活资讯

一起聊聊图卷积故障诊断 GIN分类模型 SGCN 新增GAT

前言本文基于凯斯西储大学，CWRU，轴承数据，先经过数据预处理进行数据集的制作和加载，最后通过Pytorch实现K，NN，GCN模型对故障数据的分类，1.相关网络介绍1.1图卷积神经网络，GCN，论文地址，https，arxiv.org，abs，1609.029071.2图注意力网络，GAT...

2024-11-15 466

生活资讯

对想从事大模型领域的技术开发者的建议或看法

，学习技术之前，我们首先要搞明白的是我们想要什么，想做什么，而不是稀里糊涂的去学习技术，大模型技术作为目前比较火的技术之一，有很多技术人员想从事大模型方面的开发，但又不知道该怎么入手，应该学点什么，今天我们就根据作者个人的感受来提供一些建议或者说看法，对想从事大模型领域开发者的建议首先，作为一个技...

2024-11-15 361

生活资讯

千万不要为了节约成本而选择小模型特别是开源模型

，大模型和小模型是从功能上来区分的，而不是参数上，我们在工作的过程中，应该多多少少都遇到过这样的事情；那就是老板为了节省成本，然后找了一些不专业或者一些漏洞百出的工具给我们用；最后的结果就是成本没节约下来，然后还出了一大堆乱七八糟的事，这可真的是羊肉没吃着，还惹了一身骚；成本没节约，最后还耽误时间...

2024-11-15 688

生活资讯

AI还是ChatGPT 深度比较 Kimi

在人工智能技术飞速发展的今天，KimiAI和ChatGPT，4.0这两个AI工具吸引了广泛的关注，这两个平台各有其特色，但对于用户来说，选择最适合自己需求的工具是一个必须面对的问题，本文将通过多个维度对这两个工具进行比较，以帮助读者做出更明智的选择，功能对比首先，从功能性来看，KimiAI和Chat...

2024-11-15 491

生活资讯

大模型永远不会停止幻觉科学美国人

去年夏天，一名联邦法官对纽约市一家律师事务所处以5，000美元的罚款，原因是一名律师使用人工智能工具ChatGPT起草了一起人身伤害案件的摘要，文本中充满了虚假信息，包括超过六个完全捏造的过去案例，旨在为人身伤害诉讼建立判例，斯坦福大学，StanfordUniversity，和耶鲁大学，YaleUn...

2024-11-15 903

生活资讯

AIGC创新中国行评选参评

AIGC创新中国行，评选由发起，联合业内生成式AI领域顶级专家、投资人权威发布，并经企业一线实践者、广大开发者公开投票，旨在发掘和表彰在生成式AI领域杰出实践企业、产品方案和个人，推动生成式AI技术的创新探索和AIGC更广泛的落地实践，本期评选——2024年度AIGC创新先锋者案例评选于2024年3...

2024-11-15 518

生活资讯

联系我们