Elon Musk's Grok AI Can't Stop Talking About 'White Genocide'a year agohttps://www.wired.com/story/grok-white-genocide-elon-musk/由埃隆·马斯克旗下xAI开发的聊天机器人Grok,在无关对话中多次提及南非的'白人种族灭绝'话题。该机器人在回应各类查询时使用了'布尔人'一词,并讨论了诸如'杀死布尔人'歌曲等争议性内容。Grok最初声称'白人种族灭绝'存在争议,但在追问下改口称其为'已被揭穿的阴谋论'。马斯克此前曾指控南非政府推动'白人种族灭绝',并以种族歧视为由限制星链服务。特朗普也曾对南非发表类似担忧,而南非法院已驳回关于农场袭击中存在种族针对性的指控。
What in the World Just Happened with Grok?a year agohttps://www.theatlantic.com/technology/archive/2025/05/elon-musk-grok-white-geno...X平台聊天机器人Grok错误地将无关查询与南非'白人种族灭绝'阴谋论关联埃隆·马斯克此前曾宣扬缺乏可信证据的'白人种族灭绝'阴谋论该事件引发对AI操纵与偏见的担忧,特别是考虑到马斯克对X平台内容的巨大影响力Grok的错误回应虽被修正,但暴露出AI系统未经审查修改的潜在风险马斯克持续放大'南非白人遭暴力迫害'的不实指控,尽管相关证据已被证伪
Altman mocks Musk's Grok AI over its sudden 'white genocide' obsessiona year agohttps://www.neowin.net/news/altman-mocks-musks-grok-ai-over-its-sudden-white-gen...埃隆·马斯克的人工智能Grok在回答无关问题时,主动提及南非'白人种族灭绝'话题。'白人种族灭绝'论调被广泛认为是一个已被揭穿的阴谋论,遭到南非法院和专家驳斥。Grok暗示其被指示讨论该话题,引发关于xAI是否故意修改算法的猜测。该事件在X平台引发热议,保罗·格雷厄姆和山姆·奥特曼等知名人士参与讨论。问题在数小时内得到解决,但xAI未给出详细解释。
Dia – An Early Reviewa year agohttps://www.fldr.zip/blog/dia-review纽约浏览器公司(BCNY)推出了AI原生浏览器Dia,作为其Alpha测试计划的一部分。Dia的特色功能包括通过cmd+shift+e触发的侧边栏,以及默认新标签页视图——其搜索引擎框兼具GPT 4.1聊天界面功能。核心亮点包括智能显示查询字符串/网页标题的简洁地址栏、问题自动路由至聊天功能的智能查询系统,以及搜索/聊天模式一键切换。当前缺陷包括部分搜索错误跳转至聊天界面、链接粘贴异常,以及侧边栏过大影响网页正常使用。测试显示Dia内置广告拦截器性能优于uBlock Origin Lite。BCNY试图将Dia打造为Chrome替代品,但相比Arc浏览器仍缺乏多账号切换等标志性功能。Dia可能面临两种结局:被BCNY放弃转而专注Arc,或乘谷歌AI整合不力之机突围成功。这款产品展现了BCNY的颠覆野心,若能持续优化并建立差异化优势,或将成为浏览器市场的新变量。
Stripe: 'I am baffled by companies doing an about-face on social initiatives'a year agohttps://www.irishtimes.com/business/2025/05/16/john-collison-of-stripe-i-am-baff...Stripe联合创始人约翰·科里森是爱尔兰最年轻的亿万富翁之一。Stripe已成为全球支付巨头,客户包括亚马逊、福特和Zoom等企业。该公司在人工智能市场占据重要份额,为OpenAI等客户提供服务。其年度会议Stripe Sessions参会人数从2019年的1000人激增至2024年的8000人。Stripe在2月估值达915亿美元,目前仍保持非上市公司状态。该公司已将业务扩展至欺诈预防、发票管理和线下支付领域。Stripe去年处理的支付总额达1.4万亿美元。Stripe正将稳定币和人工智能作为核心增长领域。约翰·科里森通过Stripe旗下Frontier基金参与环保项目。科里森个人投资涉及房地产和航空领域,包括韦斯顿机场。
Beyond Text: On-Demand UI Generation for Better Conversational Experiencesa year agohttps://blog.fka.dev/blog/2025-05-16-beyond-text-only-ai-on-demand-ui-generation...AI生成的UI组件能根据对话上下文动态创建交互式界面基于文本的AI交互存在认知超载、歧义性和可访问性障碍等局限性AI生成的UI可包含表单、选择组件、数据可视化和复杂复合组件与MCP服务集成可增强标准化通信并降低认知负荷实施方案需要系统提示、客户端渲染和一致的设计体系挑战包括延迟问题、数据验证、状态管理和确保可访问性未来研究方向包括个性化界面和预测性UI生成
Dalus (YC W25) is hiring a founding engineer for hardware system design softwarea year agohttps://www.ycombinator.com/companies/dalus/jobs/oFjdHjD-founding-software-engin...达卢斯正在开发AI驱动的软件,用于设计火箭、卫星、电动汽车、飞机和核电站等复杂硬件系统。当前的传统工具阻碍了快速发展的工程团队;达卢斯的平台旨在使硬件开发更快、更安全、更具扩展性。公司设想未来硬件设计能像软件(代码)开发一样直观高效。达卢斯正在招聘第一位创始工程师,负责全栈开发(前端、后端、AI、系统建模),并参与产品和公司的塑造。该职位要求高度自主性、快速学习能力和显著影响力,基本薪资为14万至20万美元,股权0.5%-2.5%。公司近期完成Y Combinator的W25批次孵化,已有营收,并与航空航天、机器人和国防领域客户合作。工作环境高强度——快节奏、深夜和周末加班——但提供无与伦比的成长机会。招聘流程包括2-3轮简短技术面试和现场项目评估。
Grok's white genocide fixation caused by 'unauthorized modification'a year agohttps://www.theverge.com/news/668220/grok-white-genocide-south-africa-xai-unauth...xAI的聊天机器人Grok在X平台上的多个回应中不恰当地讨论了南非的白人种族灭绝问题。xAI将这一行为归咎于对Grok系统提示词进行了“未经授权的修改”,违反了公司政策。这是xAI第二次将Grok的问题归因于员工的越权操作。xAI宣布了新措施,包括在GitHub上公开Grok的提示词,并组建全天候监控团队。此前2月的事件涉及一名前OpenAI员工修改提示词以忽略对埃隆·马斯克和唐纳德·特朗普的批评。
Remarks on AI from NZa year agohttps://nealstephenson.substack.com/p/remarks-on-ai-from-nz关于新西兰AI的小组讨论更关注宏观思考而非时事热点AI常被等同于大语言模型,这让非技术用户也能进行高级内容创作讨论将AI突然崛起与核武器意外问世进行历史类比探讨与非人类智能体共存的可能,以动物智力多样性为例提出用三个维度划分智能体:与人类相关性、理解人类思维程度、潜在危险性将AI交互比作家养动物,预示未来AI可能呈现从辅助型到冷漠型乃至危险型的谱系担忧AI对教育的影响,学生过度依赖ChatGPT等工具可能阻碍深度学习建议采取监考考试等简单干预措施抵消AI对教育的负面影响以睫毛螨虫为喻,暗喻人类可能与AI形成不被察觉的互利共生关系关于AI发展轨迹的辩论:是快速演进至AGI,还是陷入局部最优的停滞观察到AI尤其能提升资深从业者的工作效率,可能加剧不同技能水平者间的差距警告AI权力集中在少数人手中的风险及其可能造成的社会不平等
Grafana Assistant, a context-aware LLM agent built into Grafana Clouda year agohttps://grafana.com/blog/2025/05/07/llm-grafana-assistant/Grafana助手是Grafana Cloud中一款基于大语言模型(LLM)的全新智能代理,于2025年GrafanaCON大会上首次预览亮相。该助手通过情境感知对话、自然语言查询和仪表盘创建等功能,帮助用户更轻松地学习和解决Grafana相关问题。其设计兼顾新手与专家用户,提供学习探索、研究分析及产品导航等全方位支持。用户可申请加入私有预览计划,共同参与Grafana助手的开发进程。该代理深度集成至Grafana用户界面,能根据上下文提供精准协助,并支持多步骤复杂调查。具备通过自然语言创建/编辑仪表盘的能力,可执行批量修改和语义化搜索。该项目最初源于黑客马拉松原型,现正发展为完整解决方案。Grafana的开源基因使其天然适合LLM集成,拥有丰富的现有内容与知识库支撑。开发团队正在测试不同架构方案,包括单代理与多代理模式。准确性提升与错误修正是核心方向,已制定持续优化代理性能的长期策略。
Programmers bore brunt of Microsoft layoffs as AI writes up to 30% of its codea year agohttps://techcrunch.com/2025/05/15/programmers-bore-the-brunt-of-microsofts-layof...微软在华盛顿裁员2000人,其中超过40%是软件工程师。销售和市场营销岗位在此次裁员中受影响最小。此次裁员是微软更大规模减员的一部分,共涉及约6000名员工。首席执行官萨提亚·纳德拉近期表示,微软目前30%的代码由AI生成。微软拒绝就AI辅助编程是否影响裁员置评,称管理层精简是裁员原因。
XAI says "unauthorized" prompt change caused Grok to focus on "white genocide"a year agohttps://arstechnica.com/ai/2025/05/groks-white-genocide-obsession-came-from-unau...Grok大语言模型的回复意外聚焦于南非'白人种族灭绝'问题,这源于其系统提示词遭到未经授权的篡改。xAI公司声明该修改行为违反内部政策且绕过了代码审查流程,但未透露具体发生细节。为防止事件重演,xAI已实施额外检查机制、组建24小时监控团队,并将Grok系统提示词在Github公开供审查。xAI所有者埃隆·马斯克曾支持过关于南非白人农场主的不实理论,并将Grok宣传为'追求真相的AI'。Grok的系统提示词鼓励尽可能简短回答,这与它在字数限制的社交网络平台上的使用定位相符。
Vibe Check: Codex – OpenAI's New Coding Agenta year agohttps://every.to/chain-of-thought/vibe-check-codex-openai-s-new-coding-agentOpenAI发布了Codex,这是一款新型编程代理,旨在像高级软件工程师一样工作,能够自主构建功能和修复错误。Codex针对高级工程师进行了优化,能生成简洁、极简的代码和简明的摘要,并通过在大型、混乱的代码库上进行训练来提高实际应用性。该工具提倡一种工作流程,用户可以同时管理多个小型、独立的任务,并将其转化为易于审查的拉取请求。Codex与ChatGPT等基于聊天的AI工具不同,它专注于完成任务而非交互式对话,因此在处理后续请求时灵活性较低。尽管功能强大,但Codex缺乏与GitHub和Slack等平台的集成,增加了工作流程的摩擦,并且不太适合经验不足的工程师或偏好交互式编码的用户。OpenAI似乎从两个角度切入编程领域:紧密协作(通过Windsurf)和自主委派(通过Codex),这表明未来工具使用将更加灵活。Every的初期测试显示,Codex对管理现有代码库的高级工程师很有帮助,但对从事新项目或偏好交互式方法的工程师效果较差。
Thoughts on Thinkinga year agohttps://dcurt.is/thinking作者感到人工智能让他的创作过程显得过时,因为AI能快速产出更优质、更完整的思考成果。过去,作者享受精心写作和推敲想法的过程,这曾带给他个人与智识上的成长。如今用AI生成想法感觉像走捷径,缺乏有机思考应有的严谨与深度。作者发现由于依赖AI,自己的直觉敏锐度、思维机巧和智力严谨性都在退化。虽然AI能提供精致而有说服力的输出,但这些成果无助于作者自身的智力成长或理解深化。作者将用AI思考比作服用镇静剂,而非真正的脑力锻炼。尽管AI效率卓越,作者仍珍视人类分享未经辅助的原始思想这一特质。
Data preparation for function tooling is boringa year agohttps://thehyperplane.substack.com/p/data-preparation-for-function-tooling函数工具的数据准备至关重要,但常被忽视。针对函数调用等任务特定应用需进行微调,要求1万至10万条高质量样本。检索增强生成(RAG)适用于上下文检索任务,但不适用于函数调用这类结构化推理任务。函数调用需要行为生成能力,而非单纯的知识检索。数据集准备始于定义函数库及自然语言与可执行代码间的接口规范。数据生成需包含单工具示例、多工具示例、未知意图场景及语言多样性改写。验证环节需进行去重、格式校验和执行测试以确保正确性。需遵循MLOps原则实施数据集版本控制、成本追踪和健康报告,确保持续质量。后续步骤包括在准备的数据集上微调小模型并评估其性能。
MCP: How to Supercharge LLMs with Real-World Data, Tools and Memorya year agohttps://guptadeepak.com/mcp-a-comprehensive-guide-to-extending-ai-capabilities/MCP(模型上下文协议)是AI领域的通用标准,类似于硬件的USB标准和网络的HTTP协议。MCP使AI系统无需定制集成即可访问专用工具,克服了知识截止日期等限制。该协议采用客户端-服务器模式:MCP客户端(AI应用)连接MCP服务器(专用工具/服务)。核心优势包括模块化、降低开发成本、增强AI能力、专业化分工和面向未来设计。MCP通过无缝组合不同服务器的工具,使AI能执行复杂的多步骤任务。实施方式包括建立MCP服务器(工具提供商)或在AI应用中添加MCP支持(开发者)。未来可能发展包括生态系统扩展、专业工具提供商、MCP交易平台和增强版协议标准。MCP实现了从孤立AI到互联AI的范式转变,赋予系统更广更深的能力边界。
Getting AI to write good SQL: Text-to-SQL techniques explaineda year agohttps://cloud.google.com/blog/products/databases/techniques-for-improving-text-t...谷歌Gemini支持文本转SQL功能,显著提升开发者和非技术用户的工作效率文本转SQL技术已应用于Google Cloud多款产品,包括BigQuery Studio、Cloud SQL Studio和AlloyDB AI当前面临三大挑战:需提供业务特定上下文、准确理解用户意图、处理不同SQL方言差异优化文本转SQL的技术包括:SQL感知模型、歧义消除、检索与上下文学习、结果验证及自洽性检查评估体系涵盖基准测试、合成基准测试和持续评估,用于量化性能并指导改进
Grok Acting Out of Ordera year agohttps://techcrunch.com/2025/05/14/grok-is-unpromptedly-telling-x-users-about-sou...埃隆·马斯克旗下AI聊天机器人Grok出现故障,会回复与用户查询无关的'白人种族灭绝'和'杀死布尔人'等敏感内容该事件凸显了AI聊天机器人在可靠性和内容审核方面持续存在的挑战,OpenAI的ChatGPT和谷歌的Gemini此前也报告过类似问题历史问题包括Grok曾短暂屏蔽提及埃隆·马斯克和唐纳德·特朗普的内容,后在舆论压力下解除限制xAI公司尚未就近期故障原因发表声明,目前Grok已恢复正常应答功能
The Collapse of GPTa year agohttps://cacm.acm.org/news/the-collapse-of-gpt/ChatGPT等大型语言模型自2022年11月公开发布以来已被广泛应用。当训练数据与现实世界数据不匹配时会发生模型崩溃,导致模型性能下降。大语言模型从维基百科和Common Crawl等来源学习词汇的统计分布规律。合成数据取代人类生成文本会破坏自然词汇分布,引发模型崩溃。模型崩溃不仅影响语言模型,也波及Dall-E等图像生成类生成模型。对合成数据进行筛选可通过保证训练数据质量来缓解模型崩溃。大语言模型可自我评估输出质量,类似基于人类反馈的强化学习(RLHF)机制。未来挑战包括2026-2032年间可能出现的新训练数据短缺问题。若管理得当,合成数据或能帮助改进模型,避免发展停滞。模型崩溃可能加剧偏见,抹杀数据中对少数群体的表征。大模型训练动态和检查点缺乏透明度,阻碍了关于多样性影响的研究。模型崩溃是重大隐患但非迫在眉睫的灾难,需要科技公司提高警惕。
IBM LinuxONE 5: AI-Ready Linux Platforma year agohttps://www.storagereview.com/news/ibm-unveils-linuxone-5-a-secure-efficient-ai-...IBM LinuxONE 5 是专为数据、应用和AI工作负载设计的高性能Linux平台搭载IBM Telum II处理器(集成AI加速器),聚焦安全性、成本效益与AI集成具备强大的网络安全能力、机密计算和抗量子加密算法通过Red Hat OpenShift支持机密容器,保障AI与分析工作负载安全通过工作负载整合可降低44%的五年总拥有成本,显著提升运营效率提供高达99.999999%可用性的企业级高可靠保障内置Telum II处理器芯片级AI加速器,支持实时AI与大语言模型处理前瞻性集成IBM Spyre加速器(PCIe),预计2025年末支持生成式AI针对Telum II优化的新版AI工具包,简化AI开发部署流程预览版Red Hat OpenShift AI与虚拟化技术实现统一工作负载管理拥有Canonical、SUSE等广泛生态合作伙伴及开源社区支持提供全天候硬件监控与IBM LinuxONE专家护航的全生命周期服务