网络资源@分享

caoniang.com

Github上的22万张NSFW图片鉴黄数据集

天猫淘宝优惠券免费分享,购物先领券,经济又实惠★↑↑↑点击上图↑↑↑ 天猫淘宝优惠券免费分享,购物先领券,经济又实惠★↑↑↑点击上图↑↑↑

先说一下Github,Github是是一个面向开源及私有软件项目的托管平台,因为只支持git 作为唯一的版本库格式进行托管,故名gitHubgitHub于2008年4月10日正式上线,除了git代码仓库托管及基本的 Web管理界面以外,还提供了订阅、讨论组、文本渲染、在线文件编辑…

程序员应该都知道Github,不知道的略过,不影响下文的阅读。

NSFW什么意思,上篇介绍过,可以自行站内搜索查看,简单来说NSFW的意思就是:不可描述的内容,你懂的

然后给大家说说Github上的22万张NSFW图片鉴黄数据集是怎么回事,从虎扑上看到一个帖子:一个22万张NSFW图片的鉴黄数据集?我有个大胆的想法……  (链接如果失效依然不影响下文阅读)

通过帖子小编知道了Github上面有个程序员分享了5个包含图片地址的文档,五个文档大概有22万张的图片链接,这些图片包被作为一个数据集,来供需要做鉴黄程序的人学习,既然是鉴黄程序,当然文档里面肯定少不了H图片,所以这是一个福利包。

如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 做一些大胆的新想法,那么数据集是必不可少的。例如图像鉴黄,我们需要使用卷积神经网络训练一个分类器,以区分正常图像与限制级图像。但限制级的图像很难收集,也很少会开源。因此最近有开发者在 GitHub 上开源了一份 NSFW 图像数据集,这是不是你们想要的?

项目地址:https://github.com/alexkimxyz/nsfw_data_scrapper

这 20 万多张图像大概分为以下 5 个类别,它们可以用 CNN 训练不同的分类器。

原文不在贴出来,贴出来也看不懂,看点关键的东西吧,点开上面的github地址链接,打开之后:先点击“raw_data文件”。

然后看到五个文件夹,分别是“drawings”、“hentai”、“neutral”、“porn”、“sexy”

1、然后你可以随便点开一个文件夹,特别是porn这个文件夹。(其他的文件点击方法一样)

2、点开porn文件夹之后,再点击“urls_porn.txt”

3、然后点击“View Raw”,会出现一个文档,文档里面全是网址,打开网址都是图片的链接,复制到浏览器即可鉴别图片。

赞(41)
本站所发内容原创或整理自网络,未经允许请勿转载槽娘网 » Github上的22万张NSFW图片鉴黄数据集
分享到: 更多 (0)

评论 1

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  1. #1

    厉害,又一找资源途径。

    性好有ni3个月前 (04-18)回复