3月份Github上最热门的数据科学和机器学习项目TOP7

bigdataway 提交于 周二, 04/17/2018 - 16:39

策划 & 编辑 | Natalie

译者 | 安翔

编辑 | Emily

AI 前线导读: 在 GitHub 上,不仅可以学习不同领域的开发技术,还可以参与多个开源项目。几乎所有的科技公司,乃至谷歌和 Facebook,都会在 GitHub 上传他们的开源项目代码,很多的机器学习编程社区都从这些开源项目中获益。

如果你平日太过繁忙,无暇在 GitHub 上去搜寻那些优秀的开源项目,那么正好,本文将为你汇总出 3 月份最热门的项目。你可以阅读这些项目来更新你的知识库,当然也可以将这些开源代码借鉴到自己的项目中。

更多干货内容请关注微信公众号“AI 前线”,(ID:ai-front)

这份榜单包含了一些非常棒的代码库。比如谷歌大脑的 AstroNet,又如人工智能神经网络可视化工具,我们汇总了多个强大的开源项目,相信它们能够帮助你扩展自己在机器学习领域的视野。

准备好了吗?让我们一起来看看 3 月份的 Top7 开源项目吧!

更多阅读:

一月份的 Top5 榜单 (https://www.analyticsvidhya.com/blog/2018/02/top-5-github-repositories-january-2018)

二月份的 Top5 榜单(https://www.analyticsvidhya.com/blog/2018/03/top-5-github-repositories-february-2018/)可参见 AI 前线往期报道: 2018 年 2 月份 Github 上最热门的数据科学和机器学习项目

Person Blocker

开源项目地址:https://github.com/minimaxir/person-blocker

Person Blocker 是一个 Python 库,它可以使用预先训练好的神经网络自动屏蔽掉图像中所有的人。它的核心算法采用 Mask R-CNN,并且在 MSCOCO 数据集上预先进行了训练。你知道更棒的是什么吗?实际上,它甚至都不需要用到 GPU!

这套算法能够屏蔽遮挡的并不仅限于人,实际上它可以屏蔽 所有对象。它能够识别 80 种不同类型的物体,包括车辆、小动物、电子产品,等等。

如果想要更多了解这个库,你可以阅读 Analytics Vidhya 的博客(https://www.analyticsvidhya.com/blog/2018/04/person-blocker-is-a-python-script-that-blocks-out-people-from-images/)。

AstroNet 

开源项目地址:https://github.com/tensorflow/models/tree/master/research/astronet

AstroNet 是用来处理天文数据的深层神经网络模型。早在 2017 年 12 月,谷歌大脑团队曾透露他们通过 AstroNet 发现了 2 颗新行星。这是一个巨大的发现,它展示了机器学习在当今世界的深远影响力。

如今,谷歌大脑已经发布了该技术相关的全部代码,任何人都可以使用。该模型基于卷积神经网络(CNN)构建 。

更多阅读:

AVBytes 上关于 AstroNet 的文章(https://www.analyticsvidhya.com/blog/2018/03/google-has-made-the-code-for-astronet-available-for-everyone/)。

ANN Visualizer

开源项目地址:https://github.com/Prodicode/ann-visualizer

ANN Visualizer 同样是一个 Python 库,它让我们仅用一行代码即可实现人工智能神经网络。它通常与 Keras 一起使用,并利用 Python 的'graphviz'库来构建出一幅整洁炫酷的神经网络图。

关于 ANN Visualizer,想要了解更多可以访问:https://www.analyticsvidhya.com/blog/2018/04/python-library-visualizes-artificial-neural-networks/。

Fast Pandas

开源项目地址:https://github.com/mm-mansour/Fast-Pandas

即便是 Python 新手也能快速体会到 Pandas 这个库的灵活性和强大的功能。作为一名数据科学家,你常常需要足够的灵活性并且能够针对不同问题想出应对之策。针对如此情形,Fast Pandas 正好可以提供多个实用方案。

这是一个非常有用的库,强烈建议大家尝试。

TensorFlow.js



开源项目地址:https://github.com/tensorflow/tfjs

使用 TensorFlow.js 这个开源库,你可以通过 JavaScript 调用 API 的方法在 Web 浏览器中训练和构建机器学习模型。如果你熟悉 Keras,那么更上层的 API 对你来说完全不在话下。

它可用 GPU 加速,并自动支持 WebGL。你可以导入预先训练好的已有模型,也可以在浏览器中对这些机器学习模型重新进行训练。

阅读更多:

https://www.analyticsvidhya.com/blog/2018/04/tensorflow-js-build-machine-learning-models-javascript/。

Caffe64



开源项目地址:https://github.com/dfouhey/caffe64

Caffe64 是一个简单小巧但功能非常强大的神经网络库。众所周知,神经网络库的安装大多都比较复杂。而 Caffe64 简化了这一切,根据其开发人员的说法,Caffe64 是最容易编译且最轻量级的神经网络库。

使用 Caffe64,相信你能体会到它的美好!

TensorFlow Hub

开源项目地址:https://github.com/tensorflow/hub

TensorFlow Hub 这个库主要用于促进机器学习模型可重用部分的发布、发现和使用。特别是它还提供了模块,这些模块是预先训练好的 TensorFlow 模型,可以在新任务上重复使用。通过在相关任务上重新使用模块,你可以:

  • 用较小的数据集来训练模型

  • 改进泛化

  • 大大加快训练速度

你以前使用过这些开源项目吗?有没有自己的使用心得?如果有,欢迎评论分享!

阅读原文

https://www.analyticsvidhya.com/blog/2018/04/top-7-github-repositories-march-2018/

分类