V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  SlipStupig  ›  全部回复第 16 页 / 共 90 页
回复总数  1786
1 ... 12  13  14  15  16  17  18  19  20  21 ... 90  
2019-05-19 13:19:27 +08:00
回复了 wesall100200 创建的主题 职场话题 如何劝同事换一台笔记本来上班?
v 站跟同事的矛盾越来越大:

- 同事居然在公司吃饭,怎么劝他放弃
- 同事自带电脑,怎么劝他放弃

未来可以预见更多这种事情:
- 同事居然穿平如的衣服,如何劝他放弃
- 同事长得很胖,如何劝他离职
- 同事没有女朋友,如何劝他善良
.....


然后 V 站标准回复就是:
如果不能改变同事,你就离职,这种帖子越看越无聊
2019-05-06 21:37:19 +08:00
回复了 flighter 创建的主题 程序员 grpc 的 server 端如何实现代码的热更新?
ingress 了解一下
2019-05-06 21:36:34 +08:00
回复了 showecho 创建的主题 English 有没有过来人说说英语学习方法?
参加国外的一些峰会,尝试自己投一些 topic 并尝试去演讲
2019-05-06 21:32:28 +08:00
回复了 ginyan 创建的主题 推广 程序员的女友系列(更新到第五篇)
@ginyan 我觉得你这个得预设一个前提,第一是学生时代,第二能经常见面的,可是工作后谁也不是无业游民,没那么多时间,学生时代大家也没经济压力都靠父母,也没那么多顾虑,这些你刨除了我认为你这些经验没啥指导价值
2019-05-06 21:26:38 +08:00
回复了 ginyan 创建的主题 推广 程序员的女友系列(更新到第五篇)
@Tmac15 开源啥的不是问题,我整理一下,把代码写的更正式一些,问题是这个不仅不能造福,大家可能在技术上越陷越深,最后还是一无所有,有这功夫不如想着怎么把自己打扮好点,把自己练壮点,我认为这个可能很有用。曾经问过一些女性朋友她们对那种瘦猴子觉得没有安全感不能保护她们(女性朋友不多,也行是少数这么想吧)

@ginyan 每天都是一问一答,根本约不出来

@wangchonglie 并没有什么用,只是增加一些话题量,产生一些简单共鸣,离成功还远着呢,如果是高手根本不需这个,我这种段位的用了也没啥用
2019-05-06 09:06:47 +08:00
回复了 ginyan 创建的主题 推广 程序员的女友系列(更新到第五篇)
兄弟我完全跟你相反啊。。

之前认识了一个非常漂亮的女孩子啊,礼貌性的交换了微信,然后就开始 Q&A 模式,基本上都是我一问她一答,真的非常累,秉着程序员对技术的执著,我就想了是不是因为我情商太低,我完全不知道她喜欢什么,于是我萌生了通过 NLP 去挖掘她喜好和性格特点,这样我不就可以弥补”情商“了嘛,而且还能省力!(想想都觉得我机智)

收集数据:

1.把妹子发过的所有原创微博抓下来
2. 把微信朋友圈所有转发的链接和公众号文章(手动采集)
3. 过去半年的天气数据(大家会很困惑,我后面会解释)

我的目的是想更了解妹子喜好和禁区以及如何激发她表达的欲望,所以需要做几个维度:情感标注、命名实体识别、主题挖掘、协同过滤和综合相关系数,我大概觉得能 cover 的类型数据应该有几类:

- 电影娱乐(数据从豆瓣上抓影评)
- 心灵鸡汤(这个找了好多数据源)
- 各种名著书籍(妹子是学文学的,推测应该喜欢这个,数据来源很多)
- 各种社会新闻( zhihu 和网易新闻)
- 评论数据(用的美团的评论)

模型训练:

- 命名识别标注,通过 jieba POS 识别,主要识别人名&地名,做一个组合
- 情感标注,通过 SVM 跑评论数据
- 主题挖掘,通过 SLDA 设置 100 个 topic,然后合并后最后有 40 个
- word2vec 训练找相似内容

数据挖掘

分析喜好
通过命名识别识别的人名和地名,分别做 tf-idf 求权重出来,把 df < 2 的全部干掉,最后出来高权重人名和地名,包含这些人名和地名的文章都可以算高价值内容(相当于阅读理解的重点)。

话题情感
然后把那几篇文章和微博拉出来,通过内容分析 topic 做一个摘要,进一步合并 topic 后做个情感标注,得到了 topic 相关的正负面信息,最终分析出来,整体情感比较偏向负面,我根据人的经验推测性格是内向型的(很有可能不对。。)。

最相关性
为了了解妹子喜欢什么,用 word2vec 跑出来最相近的书籍、地名和美食,方便我去找更多共同话题

天气因素
这个是受到英国人的启发,没事聊天气,于是我用 naive bayes 分析了情感正负面与天气的关系,最后结论是,影响不大,但是她不喜欢下雨(雨天的时候喜欢发一些负面的东西,很有可能是样本的问题)

数据画像
有了以上数据后,大概基本上掌握了性格特点,通过一顿操作后,做了一些数据完善(过程太长省略了),最终确定了画像结果


说一下最终的结果吧,跟妹子聊天确实话题变多了,隔着屏幕都能感觉她很开心,我就更开心了,但是依然没有改变一问一答的情况,我只能放弃了。大家要引以为戒不要学我这么傻!
2019-04-28 21:13:31 +08:00
回复了 tuding 创建的主题 分享发现 我总结了一个"电影院定律"
我来抬个杠,如果你家里是开电影院的,你可以选择早上 7 点包场去看电影,这样就不会有问题。2333
2019-04-23 20:44:38 +08:00
回复了 dying4death 创建的主题 职场话题 答应了的 Offer 能反悔吗
你先得确定你到底是给你发的是 offer 协议,还是卖身契
2019-04-21 07:35:36 +08:00
回复了 go 创建的主题 问与答 不会打王者荣耀,是否影响融入团队
如果你没坐过牢,你还会少认识很多狱友,那里面个个都是人才,说话又好听,你觉得遗憾不?
With great power comes great responsibility
这位兄弟,你们叫奇安信啊,不要用 360 品牌了!
2019-04-18 08:10:18 +08:00
回复了 zhongchengyong 创建的主题 程序员 机器学习/深度学习岗位对学历要求是否严格?
我发现大家把对机器学习讨论有一种“小马过河”的感觉,来聊一下关于 AI 目前我了解的情况跟大家分享一下(本人小学学历,在不知名小厂做 NLP 方向,各位说的名校 phd 格格不入,所以大家不要盲目相信我说的话),目前 AI 工作主要有两类:

1. 工程类
主要是要提高公司在业务方面产出(推荐系统、各种识别系统等等,基本上公司业务已经有很大体量了),公司会相对比较保守,会用比较成熟的框架和算法,主要偏向于业务提升指标(以淘宝双十一为例,当年我们在购物车下面加入了--”你可能喜欢的商品“,给双十一输送了 2%的 GMV ),性能指标、还有开发效率,老板并不关心你用了算法,只关心你给他带来了多少利润

2. 学术 /研究类

学术类和研究类还要分在企业研究还是在高校,企业做研究基本上都是市面上有了理论但是并不成熟更没有落地的应用,然后把这些转成可落地的产品,这种情况需要强大数学功底和相关的专业背景(一般最少得 985 硕士以上学历,更重要的是智商和平台,实在太烧钱了),高校主要是做理论论证,理论改进和新领域挖掘(只需要证明有一定可能性就行),这种基本上都是博士在做


_______

关于工程化机器学习,大家基本上没有一个流程总结,我来给大家献丑,总结一下:


------------ ----------- 根据特征数据选择模型 _____________ 模型评估 ________ +++++++
|样本收集 | ---> |特征工程 | --------------------------> | 多模型模型训练 | -------------> |调参环节| ---> |模型融合|
------------ ----------- ------------------- ----------- +++++++


通过这些流程后最终转化成工程化代码,然后上线,不停的回测数据去优化模型,其实在这个里面最重要不是算法,而是数据和特征工程, 说这么多还是希望大家对自己喜欢的事不要犹豫,Just do it !
2019-04-17 00:27:41 +08:00
回复了 kidlfy 创建的主题 Python 请教一个 mongodb 插入操作
这种时序任务 MongoDB 并不合适,influxdb 会更合适
1 ... 12  13  14  15  16  17  18  19  20  21 ... 90  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2559 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 33ms · UTC 00:24 · PVG 08:24 · LAX 16:24 · JFK 19:24
Developed with CodeLauncher
♥ Do have faith in what you're doing.