V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Morriaty  ›  全部回复第 22 页 / 共 28 页
回复总数  546
1 ... 14  15  16  17  18  19  20  21  22  23 ... 28  
2017-08-18 15:28:43 +08:00
回复了 mathzhaoliang 创建的主题 Python github 上第一个过千赞的纯数学类项目
厉害了,这是我见过的 issue/star 比例最小的 repo。
2017-08-18 14:08:13 +08:00
回复了 eben 创建的主题 程序员 话说,现在写爬虫都用 Python 吗?
显然是因为方便啊,其实现在 Node 写应该也挺方便。
2017-08-18 10:28:11 +08:00
回复了 SlipStupig 创建的主题 程序员 mongodb 同步到 elastic searh 的最佳方案是什么?
不是有 ignore error 的参数吗,还有,重复记录,应该是可以配置 upsert 的吧
2017-08-18 09:42:18 +08:00
回复了 SlipStupig 创建的主题 程序员 mongodb 同步到 elastic searh 的最佳方案是什么?
崩溃指什么?
2017-08-17 12:09:43 +08:00
回复了 can126 创建的主题 程序员 我这种资历能找到机器学习方面的工作嘛?
就算说大数据,目前也是大概分两个方向,一个数据平台开发,另一个才是算法研发。

数据平台开发依旧倾向于开发和架构,说白了就是经验,怎么把传统算法并行化,怎么合理调度 hadoop 集群的 Job 等等。
2017-08-17 09:52:29 +08:00
回复了 xinhangliu 创建的主题 Python 问几个关于 __getattr__() 的问题,求解答
1、没问题,稍微有个小瑕疵
def author(self, url):
author = Author(url, self.session)
return author

2、如果是我自己写的话,我也会写类似的方法
3、该函数返回的是类,而不是实例。
2017-08-16 17:24:56 +08:00
回复了 DoctorCat 创建的主题 程序员 Python 老人写 Java 代码,想吐,怎么治?
又不说是因为什么而换回 java.....

如果是因为 python 效率跟不上,换 golang。
如果是应用场景只有 jvm 环境支持,换 scala。
@liyu4 go 既不支持重载,又不支持函数默认参数
这就体现函数默认参数的优越性了,当然,如果是 golang,就当我没说。
2017-08-15 11:01:32 +08:00
回复了 anasplrt34 创建的主题 程序员 如何判断新闻的价值以及重复新闻的判断
总的思想是一样的,就是把 document 映射到向量空间,然后计算向量间的 cos。

难点就是怎么在特定的场景下训练合适的 doc 向量。

如果是粗粒度的聚类,tfidf+KMeans 就够了,或者直接 LDA。
但如果是细粒度的新闻去重,tfidf 就完全不够了,词序、同义词等等都是问题。
2017-08-11 17:08:16 +08:00
回复了 Morriaty 创建的主题 Python pyspider 项目启动后无响应、无报错
@binux 当然点 run 了......之前运行过,但也是卡在`data:,_on_get_info`,所以已爬取的 url list 是空,这和能否重复运行有关系吗?而且我也主动清空过 taskdb
2017-08-11 14:41:04 +08:00
回复了 jason2017 创建的主题 健康 红牛这玩意如果喝多了。。。
表示对咖啡、红牛等全免疫了......睡前一杯咖啡,半小时后睡得不省人事。
2017-08-11 12:19:38 +08:00
回复了 Morriaty 创建的主题 Python pyspider 项目启动后无响应、无报错
找到这个[issue]( https://github.com/binux/pyspider/issues/208)

但似乎`/task/project:taskid`这个路由已经遗弃了,访问`/task/{name}:data:,on_start`是 404
2017-08-09 22:34:13 +08:00
回复了 saximi 创建的主题 Python 请教一个运算符重载的问题
因为 type(self.data) == string
无聊不至于,就是真正懂算法的不多,公司里号称大数据部门,其实大部分人都是写 sql 的。

更多的时候,就是自己一个人在瞎摸,就像解一道数学题,从太阳上山到太阳下山,都没解出来,难受。
2017-08-03 10:31:18 +08:00
回复了 kingapi 创建的主题 问与答 大家用哪家网站刷面试题?求推荐
FACEBOOK、GOOGLE 等企业认证著名算法培训机构 leetcode
本身就是 py 脚本程序啊.....

你用编辑器查看一下`{PY_HOME}/bin/{command}`的源码就行了啊
2017-08-01 11:01:26 +08:00
回复了 onlyice 创建的主题 程序员 组队学习 Data Science
真的有心,看几本基础书入门之后,刷论文才是王道。

任何交流群必将沦陷为水群.......
2017-07-28 10:53:18 +08:00
回复了 dongweiming 创建的主题 Python wechat-admin: 通过 Web 管理微信和微信机器人
@dongweiming 可以理解为给成员属性做了一次 md5 吗?那不同微信号的相同好友呢?
2017-07-28 09:49:39 +08:00
回复了 Morriaty 创建的主题 Android 不懂就问,原生 app 中有类似 web 中 referer 的概念吗?
@honeycomb 希望是 referer 这种方式,因为这是统一标准。如果是 url 带 from 参数,就很难做到统一,比如从第三方 app 跳到本站页面;甚至对于站内网页,由于不同应用是不同团队,也很难统一 url 参数格式。
1 ... 14  15  16  17  18  19  20  21  22  23 ... 28  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   941 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 35ms · UTC 21:57 · PVG 05:57 · LAX 14:57 · JFK 17:57
Developed with CodeLauncher
♥ Do have faith in what you're doing.