百货快讯

Mixtral 号称超过Llama Grok 最强开源大模型易主 2

3月27日，美国数据和人工智能公司Databricks宣布开源MosaicResearch团队主导开发的通用混合专家，MoE，大语言模型DBRX，DBRX的研发历经数月，耗资约1000万美元，共包含1320亿参数，16个专家网络，每次推理时会启用其中的4个专家网络和360亿参数，DBRX在语言理解、...

2024-11-15 873

百货快讯

PLAN NATURAL LLMs在自然语言规划上的基准

一、结论写在前面论文来自GoogleDeepMind，论文标题，NATURALPLAN，BenchmarkingLLMsonNaturalLanguagePlanning论文链接，https，arxiv.org，pdf，2406.04520论文提出了NATURALPLAN，一个包含三个关键任...

2024-11-15 365

百货快讯

Llama3.1系列模型正式开源最大405B 闭源模型的统治时代将迎来结束

Meta开源了Llama3.1系列模型，最大参数规模为405B，开源也是好起来了，榜单指标直逼GPT4，o，开源追上闭源模型不再是梦！Llama系列模型确实是开源界的头部，真金白银砸出来的就是不一样，不过现在大家也都知道，榜单效果和真实使用效果也不是完全正比的，后面看看对lmsys战榜单，还有大家的...

2024-11-15 350

百货快讯

LLM实践系列

经过了数据收集、筛选、去重，马上就可以开始训练实验了，但是在实验之前，我们还需要先获取一个语言模型的基石，分词器，Tokenizer，Tokenizer的作用是对一条文本数据进行切分、词表映射，得到这条文本的token序列，用开源Tokenizer还是自己训练Tokenizer可以自己训练，也可以从...

2024-11-15 980

百货快讯

GLM4模型开源意料之中的尺寸意料之外的效果

今天智谱开了GLM，4，9B的模型，不是6B，是9B，一共开源了四个模型，Base版本模型，GLM，4，9B，、Chat版本模型，GLM，4，9B，Chat和GLM，4，9B，Chat，1M，和多模态模型，GLM，4V，9B，Chat，其中，模型为多语言模型除了支持中文、英文之外，还支持日语，韩语，...

2024-11-15 358

百货快讯

大模型是泡沫吗

我个人对llm是一种很复杂的态度，毕竟，它真的击碎了我2023年之前所有的技术积累，以前在nlp苦心钻研的训练经验、模型结构、不同任务类型的不同处理技巧，好像在ChatGPT面前显得一文不值，不过，事情都有两面性，与我的技术一起被击碎的，还有我那一潭死水的工作内容，我不再是特征工程师——，花了几个月...

2024-11-15 571

百货快讯

剖析特定领域大模型

随着人工智能技术的不断发展，大型语言模型成为人们关注的焦点之一，通用语言模型如GPT，3在各种语言处理任务上展现了强大的能力，但随着对特定领域需求的增加，领域特定的大型语言模型应运而生，这些模型通过在专业的领域内进行深入训练或精调，提供了有针对性精准定制的解决方案，在，Whataredomain，s...

2024-11-15 881

百货快讯

混元大模型国内大模型文心一言通义千问豆包 Kimichat 讯飞星火到底该用哪个智谱清言

有朋友问我，现在这么多大语言模型，哪一款最好用，这并没有标准答案，每个模型都有自己独特优势，需要根据具体的使用场景来区分，带大家一起盘点下国内比较常用的几款大模型及其特性，看看哪款适合你，百度——，文心一言，大模型产品介绍文心一言是百度基于文心大模型打造的生成式AI产品，具备跨模态、跨语言的深度语义...

2024-11-15 440

百货快讯

KimiChat 10 给你画个流程图秒让

这两天又发现了KimiChat一个牛逼的用法，现在已经在探索KimiChat的道路上越走越远，这次发掘到的牛逼用法就是可以让KimiChat直接生成流程图，是不是听着就很牛逼，没错就是像这样的流程图，你可能会有疑问，KimiChat不是不能画图嘛，接下来就给大家展示一下这个神奇用法，哦，还忘记说了，...

2024-11-15 420

百货快讯

这得来问问AI了！ AI时代下哪些专业更有前途高考结束了

最近几天高考，在试卷题目爆出来后，很多人拿AI进行解答，做全套数学、英语、理综卷子等等，尤其是今年高考的语文作文题目，本身就是与人工智能强相关，用AI生成作文描述对AI的看法，额外火爆，随着今天高考的落幕，各位高三学子也确实幸苦了，接下来就是静待好消息，准备报考自己心仪的专业和学校了，但是在报考专业...

2024-11-15 821

百货快讯

时尚穿搭想换就换各种风格一键完美搭配！这个引爆时尚圈的平台上线了

随着科技的发展，时尚领域也迎来了新的革命，传统的试衣方式逐渐被现代科技所取代，虚拟试衣间的出现使得用户可以在舒适的家中轻松体验不同的服装风格，先前给大家也介绍过一些虚拟试衣的技术，例如AnyFit或者OutfitAnyone等，今天AIGCer给大家介绍一款亲测效果超棒的，可在线操作的平台———，是...

2024-11-14 598

百货快讯

高效视觉让具身智能更快更强！华东师大&amp 上大提出TinyVLA

论文链接，https，arxiv.org，pdf，2409.12514项目链接，https，tiny，vla.github.io，具身智能近期发展迅速，拥有了大模型大脑的机械臂在动作上更加高效和精确，但现有的一个难点是，模型受到算力和数据的制约，如何使用更少的训练数据，以更快的推理速度，实现媲美Op...

2024-11-14 247

百货快讯

详解用于相似和抄袭检测的技术Shingling

本文将向你介绍shingling的概念、Shingling技术的基础知识、Jaccard相似性、以及高级技术和优化，在数字时代，信息随时可用且易于访问，需要一种能够检测抄袭，有意或无意，的技术，从内容复制到增强自然语言处理能力，Shingling的功能与众不同之处在于它扩展到各种应用程序的方式，包括...

2024-11-14 677

百货快讯

高效实现Reranker 一款好用的开源工具

Reranker是任何检索架构，RAG、Agent等，的重要组成部分，但它们通常也比PipeLine中其他部分更模糊，有时，甚至很难知道该使用哪一个，每个问题都是不同的，使用X的最佳模型不一定与使用Y的模型相同；新的重新排名方法不断涌现，该如何兼容他们呢，今天介绍一款高效扩展工具rerankers，...

2024-11-14 226

百货快讯

Agents 领域实践出真知的经验分享一年打怪升级

作者，PatrickDougherty编译，岳扬01何为，Agent，Definitions，在讨论本文的主要内容之前，需要明确定义一下本文所指的，Agent，到底是啥，借用一下这位Twitter用户的话[1]，我尽力给出了一个简明扼要的定义，该定义大致与OpenAI在ChatGPT中提及的，生成式...

2024-11-14 630

百货快讯

联系我们