让机器预测平面设计作品的视觉焦点

360 阅读2分钟
原文链接: mp.weixin.qq.com

这是一篇论文的解读,原文标题:

Learning Visual Importance for Graphic Designs and Data Visualizations

该论文解决了预测平面设计作品的视觉焦点这一问题,帮助我们预测用户点击行为,或者评估平面设计作品的设计质量,下图是其训练结果与测试结果的对比图:

该论文基于FCN像素语义分割。

Fully Convolutional Networks for Semantic Segmentation,简称FCN,是一种 end-to-end的做semantic segmentation的方法。

FCN可以基于若干种结构(VGGNet, AlexNet, SIFT-Flow)。结果最好的是基于 VGGNetFCN-32/16/8s

FCN个明显的优点:

可以接受任意大小的输入图像,而不用要求所有的训练图像和测试图像具有同样的尺寸。

可以看下本论文的训练数据,尺寸都不一样,非常自由,如下图所示:

下图为本论文的原理:

我比较关心这2个方面:

一、数据集

训练集862组,设计图跟视觉焦点图各862张;

测试集216组。

大概有个1000组数据就可以做到此论文的预测结果,可以以此为参照,准备自己的训练数据集。

GDI (Graphic Design Importance) Dataset

二、应用:

辅助设计:

        改变字体颜色,大小,位置,都会影响视觉焦点,集成到设计工具中,可以实时地告诉用户,设计图的焦点在哪里,达到辅助设计的目的。

自动生成缩略图:

        减少很多人力去做裁切缩略图的工作,以后裁切设计图,不需要美工参与了。

论文点击“阅读原文”即可查阅。

   设计+人工智能的文章推荐: 

设计+人工智能深度案例分析报告

DIY一个人工智能设计师_v0.0.1

人工智能设计师v0.0.2

人工智能设计师之智能排版v0.0.3

电影封面海报个性化推荐+人工智能设计师 v0.0.4

人工智能「 服装设计师 」上

人工智能「 服装设计师 」中

聊聊人工智能建筑师

       人工智能设计师之智能排版的另一种实现方式


以下为广告:

付费社群--知识星球

免费社群--MixLab微信群

聚集各路跨界能手——有各领域的设计师、程序员、算法专家。

也许我们可以一块做点好玩的事情。如需入群可以联系我。

赞赏专用:

关于:

本公众号定期更新关于设计师、程序员发挥创意互相融合的指南、作品。

主要技术栈:nodejs、react native、electron、Elasticsearch、Solidity、Keras。欢迎关注,转发~