生活消费
c#和java部署pytorch同事识别两个图片_深度学习根据文字生成图片教程(附python代码)...
2024-12-31 13:26

向AI转型的程序员都关注了这个号👇👇👇

人工智能大数据与深度学习  公众号:datayx

其实在过往我们生活的世界里,当人们需要获取信息的时候,更多地强调的是信息的检索和遍历,意味着去已经存在的物品中找到自己合适的。在我看来这是一种很低级的生活形态,比如我的意识中有一个某种图案的杯子,想要它,只能打开淘宝根据标签去找已经设计好的款式有没有相近的,而不能直接根据我的想法自动生成一个我需要的杯子。
又比如,我想要一张猫正在喝水的照片,只能去搜索引擎里去根据关键词搜索已经存在的猫喝水的照片,而不是自动生成一张符合我要求的照片。随着人工智能的升级,这种低级的信息获取方式一定会淘汰。
今天就介绍一种深度学习方法,如何根据文字自动生成图片。先来看下效果
输入文本:
sky is above the grass, man standing on the grass
生成的图片,是不是有点神奇:  

详细流程
关于具体的算法细节可以看下这个论文:“Image Generation from Scene Graphs”

https://arxiv.org/abs/1804.01622

1.下载代码

关注微信公众号 datayx  然后回复 图像生成  即可获取。

AI项目体验地址 https://loveai.tech

需要把sgim文件夹复制到scripts文件夹下面:  

2.安装需要的第三方库
建议用python3以上版本,在文件夹下执行
sudo pip3 install -r requirements.txt

3.下载模型
首先自行安装好wget,然后在代码目录下执行
bash scripts/download_models.sh

4.创建图片
首先,要先自己搞个描述脚本,这个脚本需要描述生成图片中的对象以及对象间的位置关系。比如以下脚本(看过《机器学习实践应用》的同学是不是会眼熟,有点像里面知识图谱的内容)
[
{
"objects": ["car", "street", "line", "sky"],
"relationships": [
[0, "on", 1],
[2, "on", 1],
[3, "above", 1]
]
}
]
描述的是car在street的上面,line在street的上面,sky也在street上面。然后在代码的根目录下执行以下代码(代码中的括号内容是注释,执行前需要去掉)
python3 scripts/run_model.py(预测脚本) --checkpoint sg2im-models/vg128.pt(下载好的模型所在地址) --scene_graphs aohai.json(上面写的脚本) --output_dir outputs(图片输出路径)最终生成的图片效果

是不是很好玩,可以自己任意添加描述脚本,生成自己想要的图片,是不是非常酷。目前来看像素还比较低,希望以后该项目可以继续更新,可以生成更多高清大图。


阅读过本文的人还看了以下

分享《深度学习入门:基于Python的理论与实现》高清中文版PDF+源代码

《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码

《深度学习之pytorch》pdf+附书源码

李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材

笔记、代码清晰易懂!李航《统计学习方法》最新资源全套

《神经网络与深度学习》最新2018版中英PDF+源码

将机器学习模型部署为REST API

FashionAI服装属性标签图像识别Top1-5方案分享

重要开源!CNN-RNN-CTC 实现手写汉字识别

yolo3 检测出图像中的不规则汉字

同样是机器学习算法工程师,你的面试为什么过不了

前海征信大数据算法:风险概率预测

【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类

VGG16迁移学习,实现医学图像识别分类工程项目

特征工程(一)

特征工程(二) :文本数据的展开、过滤和分块

特征工程(三):特征缩放,从词袋到 TF-IDF

特征工程(四): 类别特征

特征工程(五): PCA 降维

特征工程(六): 非线性特征提取和模型堆叠

特征工程(七):图像特征提取和深度学习

如何利用全新的决策树集成级联结构gcForest做特征工程并打分

Machine Learning Yearning 中文翻译稿

蚂蚁金服2018秋招-算法工程师(共四面)通过

全球AI挑战-场景分类的比赛源码(多模型融合)

斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

python+flask搭建CNN在线识别手写中文网站

中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程

不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  

长按图片,识别二维码,点关注

AI项目体验

https://loveai.tech

    以上就是本篇文章【c#和java部署pytorch同事识别两个图片_深度学习根据文字生成图片教程(附python代码)...】的全部内容了,欢迎阅览 ! 文章地址:http://ww.kub2b.com/news/16863.html
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 企库往资讯移动站 http://ww.kub2b.com/mobile/ , 查看更多   
最新文章
苹果电脑关不了机怎么办苹果手机无法关机怎么办「苹果电脑关不了机怎么办」
苹果电脑因其卓越的性能和设计赢得了众多用户的青睐,但在使用过程中,有时会遇到电脑无法关机的问题。这既可能是软件层面的原因
短剧出海赚疯了,有人月入8000多万
月入8000多万霸道总裁、平民逆袭、豪门恩怨等类型的爽文短剧不仅让国人疯狂上头,还火到了海外,收割了大批忠实的老外粉丝。在这
这不是电视剧!爸爸亲手将孩子从29楼扔下,坠落前还在喊“爸爸我爱你”
“砰!”一声巨响,29楼高空坠落的身影,划破了整个小区的宁静。楼下的人群炸开了锅,有人尖叫,有人报警,有人呆立原地。而那个
公园跳舞 音量不超55分贝手机分贝测试仪「公园跳舞 音量不超55分贝」
  本报讯(记者 王斌)景山公园和北海公园等市属公园昨天率先试点无噪音日,定在每个月的首个星期一,公园所有活动的音箱音量
幻兽帕鲁2024最全配种配方攻略:火绒手机版「幻兽帕鲁2024最全配种配方攻略:」
《幻兽帕鲁》一些帕鲁宠物可以相互之间来进行配种,以此来获得更高级别的帕鲁,词条也会更加珍稀。下面为大家整理了游戏中配种的
两年亏损52亿!建发巨资入主红星美凯龙,缘何沦为“双输困局”?
曾经头顶“中国最大家居卖场”光环的(601828.SH、01528.HK),如今却在国资入主近两年后陷入更深的泥潭。2023年,厦门国资建发
手工活150一天在家做是真的吗?(组装雨伞骨架手工活150元一天)可以挣钱的手机游戏「手工活150一天在家做是真的吗?(组装雨伞骨架手工活150元一天)」
有些小伙伴会遇到手工活150一天在家做(组装雨伞骨架手工活150元一天在家是真的吗?)的问题,没有关系,通过这篇文章希望能帮大家
华为手机怎么强制重启?全面教程助您轻松操作华为手机强制重启「华为手机怎么强制重启?全面教程助您轻松操作」
华为手机怎么强制重启?全面教程助您轻松操作在使用华为手机的过程中,可能会遇到一些问题,如手机卡顿、应用程序闪退等。遇到这
手机如何一键root三星Galaxy S9 获取root权限教程(无需解锁)安卓手机怎么root「手机如何一键root三星Galaxy S9 获取root权限教程(无需解锁)」
想玩修改游戏,想运行XP框架,想用游戏脚本刷BOSS,苦于手机不能root,找不到root的方法,怕手机root后不能保修。手机通过ROOT
余承东太猛了:华为降价2000元,买不到华为Mate60没关系华为手机降价「余承东太猛了:华为降价2000元,买不到华为Mate60没关系」
华为Mate60系列是史上最热门的手机,虽然没有举办发布会,但是国内外几乎家喻户晓,之所以有那么大的力量,主要是因为它是突破美