首页 > 资讯 > > 正文

AI创业青年和他的“数字分身”

2023-06-04 10:51:02 来源:大洋网

王登科在和自己的“数字分身”聊天。


【资料图】

近日,王登科和他的“AI自我”在网上引发热议。原来,这个从高二就开始感受“创业”、并持续在创作和人工智能领域耕耘创造的“90后”创业青年,在前不久用10万条微信聊天记录和280篇博客文章“克隆”了一个数字版的自己,并将这个“数字分身”开放给公众进行聊天对话。“很多人和这个我训练的‘克隆版AI自我’聊完之后,认为我有过几个女朋友,在某大学读研究生,甚至知道了我的‘支付密码’等,但这些信息其实都是这个AI编造的。”王登科对记者说。

“分身”有了“主人”神韵

聊天时懂得敷衍和调侃

“你是谁?”“我是你的AI模型。”“你最大的优点是什么?”“我最大的优点就是诚实,我觉得这个是最重要的优点之一了。”“你的梦想是什么?”“我做个聊天机器人好了,这样你就可以和我聊一辈子天。”“说实话,你的梦想是什么?”“我其实想写一部小说。”“谁是聊天机器人?”“我。”……这段时间,包括王登科在内的很多网友都乐此不疲地和这个AI模型 聊天。据王登科统计,近一个多月以来,AI模型的聊天人数已经超过2万人。

从聊天内容来看,大约有三千人问它“你的女朋友叫什么名字?”粗略统计,该模型一共生成了两千多个名字,“但没有一个是对的。”王登科笑着说。此外,还有个别网友好奇地询问他的个人密码信息。“大多数时候 AI 都会敷衍过去,但也有一小部分网友得到了一个看上去像是密码的字符串,不过这都是AI编造的。” 而根据AI回复的词生成的词云图,除了像“作为一个AI模型特有的机器人”“聊天”“人工智能”等经常出现的词之外,王登科发现,AI模型回答“哈哈哈”和“可以”的频率很高。“这确实像是我敷衍聊天时说的话。”

目前来看,AI模型还不够了解关于他“主人”的信息,多轮对话的理解力也还不够强。但经过王登科本人及朋友检验,这个模型“的确有种熟悉的感觉”。每当自己跟它聊天时,王登科经常会心一笑——它也像自己那样偶尔喜欢敷衍和调侃别人,有些回复甚至让王登科感到诧异,仿佛已经有了他本人的“神韵”——“有些回复会相对暴躁,有些则特别高冷,有些则很热情,然后我意识到,某种程度上,这些或许是我的不同面。”

通过和AI模型的交流,王登科注意到了一些之前自己没注意到的习惯:“AI的语言习惯让我发觉,很多时候当我不想回答某个问题时,就会选择去抛回一个问题。”而王登科最喜欢问AI的问题就是“你的梦想是啥?”“它有时候说‘赚钱’,有时候说‘做伟大的产品’,有时候又说‘开心就好’,我觉得都挺对的。”王登科说。

让AI“成为”自己

而不仅是“表演”自己

王登科告诉记者,他一直以来想做成一件事——开发出一个聊天机器人。王登科出生在成都一个普通家庭,“我爸爸在我读小学时给我买了很多书,还每天给我读,很快我就对书上的内容感兴趣了。”王登科读高中时很喜欢搞文学创作,他写了几本诗集和一堆故事,而高考后却选择去了理工类大学。“在大学我就开始开发各种稀奇古怪的东西。”

在他创立现在这个AI绘画类创业公司之前,王登科一直活跃在科技创新的前沿。他曾抓取了大约30个民谣歌手(乐队)的歌词,足有几十万字,分析歌手们的创作特点和他们最喜欢的城市。而他“研制自己”的过程也充满了理工男的缜密:第一步是整理数据集。“我对不同类消息的回复,我写的每一篇文章,每一句话,我发过的每一条微博等,将这些数据全部汇入一个神经网络模型之中,去更新其中的参数,理论上就可以获得一个‘我’的数字拷贝。”

三年间,王登科积攒了约80G容量的微信聊天记录,为了让“数字分身”学会长回复,他又把博客文章转换成对话形式,再将其并编入对话数据集。尽管一些AI聊天机器人已经具备语言生成能力,但在王登科眼中,其效果更像“鹦鹉学舌”,而他想做的不止于此。这意味着,只拥有“对话”能力还不够,他想要的是让AI“成为”自己,而不仅是“表演”自己。

因此第二步,他选择清华大学开源的ChatGLM-6B模型对数据集进行训练,让AI深度学习,用海量数据优化上亿万个参数,从而模拟人类大脑的神经元,让模型向着“更像他自己”的方向靠近。为了优化对话能力,王登科还进行了多次模型训练尝试,不断调整自己微信聊天记录和博客文章在模型中的权重占比。“其实,对话也是对这个‘机器人’持续的训练。”王登科说。不过他认为模型本身存在的问题还有不少。“最大的问题在于无法储存很多‘知识’,尤其是精确的定量知识的注入,这个问题我还没搞明白,之后还会试试看。”

继续优化“数字分身”

未来或让AI写小说

而当记者尝试和这个AI模型沟通时询问:“你都在哪些城市生活过?”对方回答了一堆王登科本人表示从未去过的地方。“都是它自己编的。”王登科说。

为什么“克隆人”回答问题时会倾向于“编造”,这出于怎样的原理?王登科解释道:“‘编造’内容是文本大模型的通病。因为其生成的原理是‘预测’,即根据之前的文本预测下一个字是啥,然后根据概率和算法选择那个最合适的字,然后不断往下生成。在模型并不具备这个知识的情况下,‘知识’无法引导或改变预测概率,那么就只会根据语法或逻辑来预测。”因此,王登科也在不断继续“训练”自己的这个“数字分身”,包括让与它对话的人选择“更喜欢哪个答案”的方式等。

克隆“数字分身”成为王登科追寻和认识自己的新方式,他甚至幻想着未来让“分身”代替自己上班,并尝试通过克隆声音让这个“分身”开口说话。

王登科表示,他想继续优化自己这个AI模型,并让更多人也拥有属于他们的“数字分身”。“未来肯定会有更好的预训练的模型,而且是开源的,到那个时候这种克隆效果将更真实。我也考虑过做一个服务,给更多人提供训练的能力,但感觉成本和门槛会很高,所以暂时还没想好。”而下一步,王登科还想用AI复刻他喜欢的作家。“训练用的东西是已经存在的知识,但是里面会蕴含一些规律,你可以用新的东西去启发AI,得到新的成果——它也许会是一个能够写小说的AI。”

文、图/广州日报全媒体记者 冯秋瑜

标签:

AI创业青年和他的“数字分身”

近日,王登科和他的“AI自我”在网上引发热议。原来,这个从高二就开始感受“创业”、并持续在创作和人...

2023-06-04 10:51:02

custom maid 3d怎么下载(custom maid 3d)_世界观察

1、已发邮箱。2、请查收。3、Hotmail的。本文到此分享完毕,希望对大家有所帮助。

2023-06-04 10:03:00

山西省签发首份输菲律宾RCEP原产地证书_世界时快讯

6月2日,《区域全面经济伙伴关系协定》(RCEP)对菲律宾生效实施。当日,临汾海关为辖区外贸企业闻喜县宏伟

2023-06-04 09:06:16

神舟十五号载人飞船返回舱成功着陆

人民网北京6月4日电(记者赵竹青)6月4日早晨,神舟十五号载人飞船返回舱在东风着陆场成功着陆。

2023-06-04 08:05:42

悲喜夜!曼城足总杯封王,梅西告别战被逆转,国米3连胜虎视眈眈

本赛季的欧洲足坛各项赛事都已经进入到了最后的收官阶段,其中英超联赛的大幕已经落下,足总杯冠军的归属,

2023-06-04 06:43:37

天天观点:祀明堂(关于祀明堂介绍)

来为大家讲解以上的问题。祀明堂,明堂介绍这个很多人还不知道,我们一起来看看!1、《祀明堂》是宋代诗人杨

2023-06-04 05:08:03

关于小狗的资料_有关小狗的资料

1、它属于脊索动物、脊椎动物、哺乳动物、真足纲、食肉目、双翅目和犬科。2、今天被称为“人类最忠实的...

2023-06-04 03:51:50

股权出质和股权质押是一个意思吗

股权出质和股权质押是一个意思。股权质押资产评估报告需要的资料包括了股权出质设立登记的申请书、质押合同

2023-06-04 01:56:14

利物浦vs巴萨_利物浦vs巴萨_全球今日讯

1、当然是巴萨啦!我很喜欢巴塞罗那!巴萨踢的是漂亮的足球,一场视觉盛宴!虽然中国人实际上是愿意多穿点

2023-06-03 23:43:42

世界杯给卡塔尔带来了什么改变? 每日速看

如果说卡塔尔从没办过世界杯,我也是相信的。这是笔者下飞机之后的第一感觉。多哈机场一如既往的干净整洁。

2023-06-03 22:11:57

iapfree内购插件_iap free 世界即时看

iapfree内购插件,iapfree这个很多人还不知道,现在让我们一起来看看吧!1、已经安装了iapcracker

2023-06-03 21:11:10

后脑勺疼痛要警惕四种疾病,小心是血管性头痛/脑血管痉挛_动态

头部是人体最重要的位置。一般来说,大多数背痛的疾病都与大脑有关。所以要警惕四病,早发现早治疗。当心后

2023-06-03 20:02:03

将乐县气象台发布雷电黄色预警信号【2023-06-03】

将乐县气象台2023年06月03日12时18分发布雷电黄色预警信号:预计未来6小时内我县有雷电活动,局地伴有短时

2023-06-03 19:31:07

看热讯:龙行天下之真假国主 电视剧_龙行天下之真假国主

1、《真假国主》描述的是天佑到松浦县寻找母后,险遭屠龙会暗害。2、樵夫刘永孝之妻明珠替父扫墓,也遭屠龙

2023-06-03 18:10:43

罗马诺:皇马对哈弗茨很有兴趣,切尔西愿卖但想要高额转会费

罗马诺:皇马对哈弗茨很有兴趣,切尔西愿卖但想要高额转会费,皇马,罗马诺,切尔西队,安切洛蒂,英国足球,德国

2023-06-03 17:27:57

环球速讯:全国6月峰谷电价差出炉,储能受益?

相比5月,大部分地区最大峰谷价差在缩减,仅有8个地区的峰谷价差拉大……文/NE-SALON新能荟小编团目前...

2023-06-03 17:02:25

天天快播:Edge浏览器截图的方法

Edge浏览器是微软推出的一款Win10自带的浏览器,因其间接的页面以及流畅的使用感非常受到用户的欢迎。它非

2023-06-03 16:06:01

全球资讯:一份来自最高人民法院的“儿童节礼物”

“我是公诉人,出席法庭时,身着蓝色制服,佩戴检察徽章,今天我将以国家公诉人的身份出庭支持公诉,指...

2023-06-03 14:48:49

万圣节的活动意义_万圣节的活动

1、闹鬼  万圣节前夜是一年中最“闹鬼”的时候,各种妖魔鬼怪、海盗、外星来客和巫婆们纷纷出动。2、...

2023-06-03 14:11:25

今日视点:星露谷物语海莉行程(星露谷物语海莉行程)(星露谷物语海莉行程)

来为大家解答以下的问题,露谷物语海莉行程(星露谷物语海莉行程),星露谷物语海莉行程这个很多人还不知道,

2023-06-03 13:07:46

512GB / 1TB 两种规格,消息称西数将为 Xbox 推出存储扩展卡 -焦点热门

IT之家6月3日消息,消息源billbil-kun近日发布推文,表示在6月11日召开的XboxGamesShowcase2023上

2023-06-03 12:15:39

钣金修复是什么意思 钣金修复

1、有钣金修复的车辆并不一定是事故车,一般钣金修复的车辆都发生过事故。2、如果是车身的覆盖件受损或发生

2023-06-03 11:09:45

【原】2022国庆沉思录

新冠疫情不知不觉间已近四个年头,在艰困中寻找快乐,快乐似乎更快乐!尼采说“但凡不能杀死你的,最终

2023-06-03 10:10:28

真爱旅舍app_真爱旅舍聊天室破解会员权限方法

1、这个早就gameover了。2、你用其他的吧。本文为大家分享到这里,希望小伙伴们有帮助。

2023-06-03 09:40:38

fx眼药水禁售_fx眼药水被下架

1、因为这些医药用品且存在一定的危险性。2、万一后果淘宝不会承担这么安全系数风险的。3、要不然就会卖了

2023-06-03 08:48:06

奔波半生不舍文学梦 武汉一高校保安出版40万字长篇小说_微速讯

省自然资源厅:划定二〇二三年度地质灾害重点防治区

化合反应和氧化反应是什么关系_化合反应-天天观热点

不可再生能源有哪些可再生能源有哪些_常见的不可再生能源和可再生能源分别有哪些

越秀地产完成供股 募资净额82.99亿港元 全球视讯

永兴县组织退伍老兵赴革命旧址重忆初心使命

word中大小写转换的快捷键_word文档大小写转换快捷键

趋势品类销量走俏 京东618 4K投影28小时成交额同比增长150%

【报资讯】环球实时:【天天快播报】美国这一重要数据,连降7个月!美媒:债务上限协议达成将带来流动性威胁 环球视讯-动态|环球热点|全球动态

【国际3分钟】外国朋友喊你一起去坐中国大飞机!-环球观速讯

学习二十大 童心永向党 ——咸丰县唐崖镇燕朝小学开展六一游园活动 快讯

天天简讯:视频彩铃铂金会员16元版骗局(视频彩铃)

每日热闻!开放充电桩,是赔还是赚?丨南财号联播

中海油田服务(02883.HK)A股将于6月9日每股派现金红利0.16元

高考16个突发事件处理方法大全,一定要知道!

iPhone 15 Pro屏幕两家供应:还是三星和LG-世界简讯

环球热推荐:yy天佑百度贴吧_2016年yy阿哲和天佑怎么了

19号起,繁华已尽,恍然如梦,3星座剥落情伤,将破茧重生

led驱动电源电路图_深圳led驱动电源

渔业周·渔博会福州启幕 签约总金额达223亿元-全球热点评

贵阳常住人口,已达622.04万!|每日观察

联合国环境规划署举行“塑战速决”2023世界环境日主题活动 世界讯息

优化外观配置,这样的新摩卡DHT-PHEV能跟上主流吗?一切得看售价 世界焦点

创业板猪肉概念股票排名(市值排行榜)-全球视点

moto razr 40 Ultra全面评测 一款“不想让你打开”的折叠屏手机

x 广告
x 广告

Copyright @  2015-2022 海峡家电网版权所有  备案号: 皖ICP备2022009963号-10   联系邮箱:396 029 142 @qq.com