2022年12月趋势观察:AI、加密货币、元宇宙等方面的进展
本月的新闻因TFX的崩溃和埃隆·马斯克的推特可能内爆而被掩盖。所有的噪音并不意味着重要的事情没有发生。许多公司、组织和个人都在努力应对生成型人工智能的版权问题。谷歌正在玩一个漫长的游戏:他们认为目标不是模仿艺术作品,而是为人类与人工智能合作建立更好的用户界面,以便他们能够创造出新的东西。Facebook开发的会玩虚拟外交游戏《强权外交》(Diplomacy)的人工智能是一项令人兴奋的新发展。《强权外交》需要玩家与其他玩家进行谈判,评估他们的心理状态,并决定是否履行承诺。对于人工智能来说,这些都不是简单的任务。IBM现在拥有一个433量子比特的量子计算芯片,这是制造有用的量子处理器的重要一步。
人工智能
Facebook开发了一个玩《强权外交》的人工智能系统。Diplomacy是一款棋盘游戏,包括玩家之间的无约束力谈判,形成合作或导致背叛。除了了解其他玩家并维护与他们的关系之外,还需要广泛使用自然语言。
Shutterstock将与OpenAI合作,建立一个基于DALL-E的模型,该模型只接受过Shutterock许可的艺术培训。他们还将制定一项计划,补偿那些曾将作品用于训练该模型的艺术家。
Facebook的大型科研语言模型Galactica只在网上存活了3天。它生成的科学论文听起来很合理,但内容往往与事实不符,包括真正科学家的“假研究”。它很容易产生针对几乎所有少数民族的仇恨研究。
谷歌在HuggingFace上推出了Switch Transformers语言模型。这是一个非常大的混合专家模型(1.6万亿参数),使用许多子模型。尽管规模大,但Switch Transformers还是相对快速和高效的。
OneAI已经推出了一项自然语言处理即服务的服务,基于OpenAI的Whisper模型。Whisper相对较小,非常准确,支持多种语言。
人工智能治理——包括解释和审计结果的能力——如果人工智能要在公众信任度下降和监管日益加强的时代蓬勃发展,它是必不可少的。
研究人员开发了一种人工智能系统,该系统通过使用自然语言界面询问人类所看到的东西来学习识别物体。这可能是一条通向更有效学习的人工智能的道路。
谷歌正在为其大型语言模型LaMDA开发一种人机回圈(Human-in-the-loop)工具,旨在帮助作家与人工智能互动,创作故事。Wordcraft Writers Workshop是与LaMDA合作的另一个项目。“使用LaMDA编写完整的故事是一条死胡同。”
Infinite Conversation——可生成维纳·赫尔佐格和斯拉沃热·齐泽克之间的无限对话。
Code as Policies将AI代码生成扩展到机器人:它使用大型语言模型从语言描述中为机器人任务生成Python代码。其结果是机器人可以执行未经明确训练的任务。代码可以在GitHub上找到。
AskEdith是用于将英语转换为SQL的数据库的自然语言接口。
Facebook使用人工智能构建了一个音频编译码器,其效率比MP3高10倍。
SetFit是一个小得多的语言模型(GPT-3大小的1/1600),它允许较小的组织用最少的训练数据构建专门的自然语言系统。
具有较少关注层的Wide transformer模型可以减少大型语言模型的大小(和功率要求),同时提高其性能和可解释性。
半监督学习(Semi-supervised Learning)是对大型数据集进行标记的部分自动化过程。从少量手工标记的数据开始,训练一个模型来标记数据;使用该模型;检查结果的准确性;以及再培训。
加密货币和区块链
澳大利亚证券交易所取消了其长达6年的区块链实验,该实验将把大部分工作放在类似区块链的共享分布式账本上。
Vitalik Buterin对FTX的失败做出了回应,他假设了一个独立于审计和其他 "法币 "方法的 "偿付能力证明"。这个主题很熟悉:加密货币能否更接近于去信任?
NFT的一个“卖点”是,版税可以在转售NFT时转给创作者。然而,许多市场并不强制支付版税,而在NFT的智能合约中纳入版税几乎是不可能的。包括Magic Eden和OpenSea在内的一些市场已经开发了强制支付版税的工具。
元宇宙
一个国家能把自己上传到元宇宙吗?在COP27气候峰会上,图瓦卢外交部长尖锐地提出,这可能是他们解决全球变暖的唯一办法。他们的地理、文化和国家主权可以在虚拟世界中得到保护。
Dark Forest是一款基于区块链的大型多人在线游戏。这几乎可以说是基于区块链技术的最复杂的游戏。没有中央服务器;它可能为建立一个真正去中心化的元宇宙指明方向。
什么时候VR与现实世界联系太紧密了?Oculus的创始人Palmer Lucky制造了一款VR头盔,如果你在游戏中死亡,就会被杀死。虽然他说这只是“办公室艺术”,但他似乎相信这样的设备最终会成为真正的产品。
互联网以无人能预测的方式有机发展。Ben Evans认为,如果元宇宙发生了,它也会有机地发展。这并不是不做实验的借口。但这是一个不应该在相互冲突的定义上投入太多的理由。
安全
美国国防部发布了到2027年实现零信任的路线图。
一项新的勒索软件攻击除了窃取加密文件外,还窃取了受害者的Discord帐户。理论上,Discord账户可能被用于发起加密货币和NFT骗局。无论如何,这是网络犯罪分子看到价值所在的明确迹象。
95%的网络应用都存在安全漏洞。77%的应用存在OWASP Top Ten中列出的漏洞:配置错误、访问控制中断和其他基本问题。信息安全领域最大的问题仍然是把基础工作做好。
随着加密货币价格暴跌,合法挖矿无利可图,加密劫持(用植入他人应用程序的恶意软件挖采加密货币)的流行程度持续上升。
一个名为Worok的威胁组织正在使用隐写术将恶意软件隐藏在PNG图像中。
所有主要浏览器(Chrome、Firefox、Safari)都信任那些允许一些不值得信任的公司充当证书颁发机构的证书。这些公司参与了在网站上植入间谍软件以收集用户的个人数据等活动。
一场大规模的SEO中毒活动已经破坏了15000个WordPress网站,其目的是让谷歌搜索将人们送往虚假的问答网站。这可能是使用假冒网站进行钓鱼或安装恶意软件的前兆。
英国政府已开始扫描英国境内的所有互联网设备。其目的是检测漏洞。
网络攻击越来越多地针对中小型企业,其中绝大多数企业没有防御或灾难恢复计划。
MFA疲劳攻击是针对多因素认证的一种新的攻击方式:用自动化请求轰炸用户,希望他们能意外地批准一个。
编程
DuckDB是一个非常快速的数据库,专为中小型数据集的在线分析处理(OLAP)而设计。它可以在笔记本电脑上轻松运行,并与Python很好地集成。
你如何管理软件物料清单 (SBOM)?建立软件物料清单是一回事;在项目开发和部署过程中保持其准确性是另一回事。
包括微软和亚马逊在内的近200家公司都在使用Rust,是时候去研究一下了;Azure的首席技术官强烈建议开发人者避免使用C或C++,而选择Rust。
Copilot之后会发生什么?Github正在研究语音到代码:无键盘编程。
genv是管理GPU使用的工具,是MLOps中经常被忽略的部分。与CPU不同,它们通常是静态分配的,如果使用不足或未使用,则无法重新分配。
多域服务协调可能是Kubernetes之外的下一步:在完全不同的环境中运行的软件组件之间的协调。
Rewind是一款未发布的Mac产品,它声称可以记录你所做的、看到的或听到的一切,以便你以后可以查阅。尽管用户可以开启和停止录制,但对隐私和安全性有明显的影响。关键技术似乎是极其有效的压缩。
数据库的渐进式交付(Progressive Delivery)?正如James Governor所指出的,数据库模式已经被CI/CD抛在后面。这可能正在发生变化。
Turbopack是Next.js的一个新的基于Rust的捆绑器,承诺了大大提高性能。与Webpack不同,Turbopack可以进行增量构建,并用于开发和生产。
Shell脚本永远不会过时。这里有一些最佳实践,从“始终使用bash”开始。
量子计算
Scott Aaronson在YouTube上发布了他的量子计算本科课程的“极度压缩”(3小时)版本。这是一个很好的入门方法。
Horizon Quantum Computing正在推出一个开发平台,让程序员用C或C++等语言编写代码,然后为量子计算机进行编译和优化代码。
IBM已经创建了一个433量子比特的量子计算芯片,并通过改进的纠错功能更新了Qiskit运行时。这是向前迈出的一大步,尽管我们离可用的量子计算还很远。
网络
从推特到Mastodon的用户流意味着ActivityPub协议(Mastodon联邦设计背后的协议)值得了解。Mastodon不会(也不能)犯剥夺开发者对新客户和其他应用程序的特许权的错误。
谷歌正在其排名中对人工智能生成的内容进行处罚。
本月的新闻因TFX的崩溃和埃隆·马斯克的推特可能内爆而被掩盖。所有的噪音并不意味着重要的事情没有发生。许多公司、组织和个人都在努力应对生成型人工智能的版权问题。谷歌正在玩一个漫长的游戏:他们认为目标不是模仿艺术作品,而是为人类与人工智能合作建立更好的用户界面,以便他们能够创造出新的东西。Facebook开发的会玩虚拟外交游戏《强权外交》(Diplomacy)的人工智能是一项令人兴奋的新发展。《强权外交》需要玩家与其他玩家进行谈判,评估他们的心理状态,并决定是否履行承诺。对于人工智能来说,这些都不是简单的任务。IBM现在拥有一个433量子比特的量子计算芯片,这是制造有用的量子处理器的重要一步。
人工智能
Facebook开发了一个玩《强权外交》的人工智能系统。Diplomacy是一款棋盘游戏,包括玩家之间的无约束力谈判,形成合作或导致背叛。除了了解其他玩家并维护与他们的关系之外,还需要广泛使用自然语言。
Shutterstock将与OpenAI合作,建立一个基于DALL-E的模型,该模型只接受过Shutterock许可的艺术培训。他们还将制定一项计划,补偿那些曾将作品用于训练该模型的艺术家。
Facebook的大型科研语言模型Galactica只在网上存活了3天。它生成的科学论文听起来很合理,但内容往往与事实不符,包括真正科学家的“假研究”。它很容易产生针对几乎所有少数民族的仇恨研究。
谷歌在HuggingFace上推出了Switch Transformers语言模型。这是一个非常大的混合专家模型(1.6万亿参数),使用许多子模型。尽管规模大,但Switch Transformers还是相对快速和高效的。
OneAI已经推出了一项自然语言处理即服务的服务,基于OpenAI的Whisper模型。Whisper相对较小,非常准确,支持多种语言。
人工智能治理——包括解释和审计结果的能力——如果人工智能要在公众信任度下降和监管日益加强的时代蓬勃发展,它是必不可少的。
研究人员开发了一种人工智能系统,该系统通过使用自然语言界面询问人类所看到的东西来学习识别物体。这可能是一条通向更有效学习的人工智能的道路。
谷歌正在为其大型语言模型LaMDA开发一种人机回圈(Human-in-the-loop)工具,旨在帮助作家与人工智能互动,创作故事。Wordcraft Writers Workshop是与LaMDA合作的另一个项目。“使用LaMDA编写完整的故事是一条死胡同。”
Infinite Conversation——可生成维纳·赫尔佐格和斯拉沃热·齐泽克之间的无限对话。
Code as Policies将AI代码生成扩展到机器人:它使用大型语言模型从语言描述中为机器人任务生成Python代码。其结果是机器人可以执行未经明确训练的任务。代码可以在GitHub上找到。
AskEdith是用于将英语转换为SQL的数据库的自然语言接口。
Facebook使用人工智能构建了一个音频编译码器,其效率比MP3高10倍。
SetFit是一个小得多的语言模型(GPT-3大小的1/1600),它允许较小的组织用最少的训练数据构建专门的自然语言系统。
具有较少关注层的Wide transformer模型可以减少大型语言模型的大小(和功率要求),同时提高其性能和可解释性。
半监督学习(Semi-supervised Learning)是对大型数据集进行标记的部分自动化过程。从少量手工标记的数据开始,训练一个模型来标记数据;使用该模型;检查结果的准确性;以及再培训。
加密货币和区块链
澳大利亚证券交易所取消了其长达6年的区块链实验,该实验将把大部分工作放在类似区块链的共享分布式账本上。
Vitalik Buterin对FTX的失败做出了回应,他假设了一个独立于审计和其他 "法币 "方法的 "偿付能力证明"。这个主题很熟悉:加密货币能否更接近于去信任?
NFT的一个“卖点”是,版税可以在转售NFT时转给创作者。然而,许多市场并不强制支付版税,而在NFT的智能合约中纳入版税几乎是不可能的。包括Magic Eden和OpenSea在内的一些市场已经开发了强制支付版税的工具。
元宇宙
一个国家能把自己上传到元宇宙吗?在COP27气候峰会上,图瓦卢外交部长尖锐地提出,这可能是他们解决全球变暖的唯一办法。他们的地理、文化和国家主权可以在虚拟世界中得到保护。
Dark Forest是一款基于区块链的大型多人在线游戏。这几乎可以说是基于区块链技术的最复杂的游戏。没有中央服务器;它可能为建立一个真正去中心化的元宇宙指明方向。
什么时候VR与现实世界联系太紧密了?Oculus的创始人Palmer Lucky制造了一款VR头盔,如果你在游戏中死亡,就会被杀死。虽然他说这只是“办公室艺术”,但他似乎相信这样的设备最终会成为真正的产品。
互联网以无人能预测的方式有机发展。Ben Evans认为,如果元宇宙发生了,它也会有机地发展。这并不是不做实验的借口。但这是一个不应该在相互冲突的定义上投入太多的理由。
安全
美国国防部发布了到2027年实现零信任的路线图。
一项新的勒索软件攻击除了窃取加密文件外,还窃取了受害者的Discord帐户。理论上,Discord账户可能被用于发起加密货币和NFT骗局。无论如何,这是网络犯罪分子看到价值所在的明确迹象。
95%的网络应用都存在安全漏洞。77%的应用存在OWASP Top Ten中列出的漏洞:配置错误、访问控制中断和其他基本问题。信息安全领域最大的问题仍然是把基础工作做好。
随着加密货币价格暴跌,合法挖矿无利可图,加密劫持(用植入他人应用程序的恶意软件挖采加密货币)的流行程度持续上升。
一个名为Worok的威胁组织正在使用隐写术将恶意软件隐藏在PNG图像中。
所有主要浏览器(Chrome、Firefox、Safari)都信任那些允许一些不值得信任的公司充当证书颁发机构的证书。这些公司参与了在网站上植入间谍软件以收集用户的个人数据等活动。
一场大规模的SEO中毒活动已经破坏了15000个WordPress网站,其目的是让谷歌搜索将人们送往虚假的问答网站。这可能是使用假冒网站进行钓鱼或安装恶意软件的前兆。
英国政府已开始扫描英国境内的所有互联网设备。其目的是检测漏洞。
网络攻击越来越多地针对中小型企业,其中绝大多数企业没有防御或灾难恢复计划。
MFA疲劳攻击是针对多因素认证的一种新的攻击方式:用自动化请求轰炸用户,希望他们能意外地批准一个。
编程
DuckDB是一个非常快速的数据库,专为中小型数据集的在线分析处理(OLAP)而设计。它可以在笔记本电脑上轻松运行,并与Python很好地集成。
你如何管理软件物料清单 (SBOM)?建立软件物料清单是一回事;在项目开发和部署过程中保持其准确性是另一回事。
包括微软和亚马逊在内的近200家公司都在使用Rust,是时候去研究一下了;Azure的首席技术官强烈建议开发人者避免使用C或C++,而选择Rust。
Copilot之后会发生什么?Github正在研究语音到代码:无键盘编程。
genv是管理GPU使用的工具,是MLOps中经常被忽略的部分。与CPU不同,它们通常是静态分配的,如果使用不足或未使用,则无法重新分配。
多域服务协调可能是Kubernetes之外的下一步:在完全不同的环境中运行的软件组件之间的协调。
Rewind是一款未发布的Mac产品,它声称可以记录你所做的、看到的或听到的一切,以便你以后可以查阅。尽管用户可以开启和停止录制,但对隐私和安全性有明显的影响。关键技术似乎是极其有效的压缩。
数据库的渐进式交付(Progressive Delivery)?正如James Governor所指出的,数据库模式已经被CI/CD抛在后面。这可能正在发生变化。
Turbopack是Next.js的一个新的基于Rust的捆绑器,承诺了大大提高性能。与Webpack不同,Turbopack可以进行增量构建,并用于开发和生产。
Shell脚本永远不会过时。这里有一些最佳实践,从“始终使用bash”开始。
量子计算
Scott Aaronson在YouTube上发布了他的量子计算本科课程的“极度压缩”(3小时)版本。这是一个很好的入门方法。
Horizon Quantum Computing正在推出一个开发平台,让程序员用C或C++等语言编写代码,然后为量子计算机进行编译和优化代码。
IBM已经创建了一个433量子比特的量子计算芯片,并通过改进的纠错功能更新了Qiskit运行时。这是向前迈出的一大步,尽管我们离可用的量子计算还很远。
网络
从推特到Mastodon的用户流意味着ActivityPub协议(Mastodon联邦设计背后的协议)值得了解。Mastodon不会(也不能)犯剥夺开发者对新客户和其他应用程序的特许权的错误。
谷歌正在其排名中对人工智能生成的内容进行处罚。