小红书热榜已修复 |
还是创业的都在忙?
想找个团队/项目加入
@Nihuanjian 是啊,资深码工。感觉发消息的多,团队少
@gocome 估计好多和楼主一样,正在找项目。也有好多创业者正在找团队。
@Bence 小狼想做神马?
@zhouzhe8013 有个朋友在创业,可以介绍认识一下
@Bence 我以为你自己要搞点啥有意思的东西呢 哈哈 要是你自己搞我果断支持一下,免费.
@Bence 加我微信吧 gao_gaox
@zhouzhe8013 一起?
@gocome 来啊 有啥想法么
@zhouzhe8013 node js做不?我最近在看,想弄个可以记录保存的web白板,加语音,例子:
http://ramkulkarni.com/blog/record-and-playback-drawing-in-html5-canvas-part-ii/
它这是全浏览器端的,可以发到服务器保存,然后回放。简单的不难,但是要把白板做好,还是有些麻烦的。
这是单人的,以后可以加实时多人……
@haotrader 华尔街你好,你是做金融的吗?
@zhouzhe8013
@cnpython
来做点什么吧,我觉得adminlte不错啊,可以做个企业的管理/报表
@zhouzhe8013 说起adminlte,我是想到了http://www.spiderstrategies.com/ ,这是一家做corporate performance management的。国内市场上同类产品应该有吧,不过我还没听说过。
简单的,可以先做个dashboard。后台的数据model,数据分析,到前台显示柱图、饼图,等等。技术上也有浅有深
好象需要一个做财务或者管理的人
来选一个吧
@zhouzhe8013 @gocome 就是没方向呀,等你们召唤,嘿嘿。
@cnpython
@wulien
@zhouzhe8013
来做个用户管理系统吧。包括一整套的用户注册流程、密码规则,oauth2,短信、邮件确认到微信微博登录,等等,提供rest api给别人……感觉应该有搞头
现在这么多创业的,哪家都得有用户管理
java,groovy&grails,flask都可以,最近没看django
以后可以发展数据分析,分析用户使用习惯啥的
@gocome 不觉得用户管理这个有搞头,早就被互联网巨头用oauth2垄断了,国内的微信、qq、微博(分先后),国外的google和facebook,twitter。
反正现在不能oauth2登录的应用我一般就直接路人了————随便一个用户名密码天天在邮件找回密码,都一致的话,又怕被撞库。。
google的用户管理做的很好,基于手机短信或者app的二次验证。然后通过chrome登录其他应用的用户名密码保存到云端,加密存储,于是我再也不用用文本记各种用户名密码了。。
@gocome: @tracymcladdy 说的是对的,早就没市场玩了
@tracymcladdy 跟我理解的用户管理不太一样。微信微博那些更多的是一个社交性的app,他们的目的不是用户管理,只不过提供了一个oauth2的接口。缺了很多用户管理的功能,比如用户的权限、分组。oauth2只是对外的接口,和用户管理还是有区别的。
而且没有哪个app是完全没有自己的用户系统的吧。都得上一套用户注册、登录的系统。不可能完全依赖第三方登录的。
@dimayi http://www.dpreview.com/ ? 怎么个想法?博客类的网站有现成的模板的
@gocome 但是你会认为别的公司会愿意把自己包涵手机号的核心用户的数据放到你这么?开源的轮子我直接拿来用可能会有兴趣,restful方式调用别人的api,把数据给别人我肯定不干。
@zhoufanyin85 做过?来交流下呗
@tracymcladdy 你要是用那些云端服务,何止是用户数据,整个网站都在别人的平台上了……
@gocome 是哇..所以稍微大点的公司都是自己搭云服务的......
阿里云之前好像也冒出了次误删用户资料的事吧.居然有用root跑的监控程序在主机上!!!root啊!!!这尼玛为了数据完全没有一点节操了!!!有的连ls, chmod这样的命令都被误当作病毒干掉了......
所以当前大环境下国内企业的节操完全信不过......你的restful提供服务在这个大环境下肯定没啥人敢用......
@tracymcladdy 这个就没办法了。那我只能说,去做要比讨论更能看到结果吧。
@tracymcladdy 今天在社区看到阿里云的帖子,这个云啊,web service啊还是大方向
http://www.guanggoo.com/t/9147
是这个阿里云的帖子吗?他们是光谷的一个孵化器和产业基地,这次活动说实话,可能就是一个推广会。
@zhoufanyin85 可能是推广,但是我觉得这是一个趋势了。netflix全部都放在亚马逊的云上,还有其他公司。从服务来说,也有不少公司提供数据分析,BI之类的
@gocome 云是大方向肯定没错。。肯定是替代服务器托管和自建机房的。。。不过阿里这样的企业在我这是冷淡声望。。就想着流量入口和偷那点数据。。。早就路人了。。
所以我认为私有云是方向。。我还准备在家里自己搭个nas玩呢。。
@tracymcladdy 大企业做私有云,中小企业也搞会亏本的吧?而且云的一个特点是有弹性,如果没有相差很大的淡季旺季,搞个云都意义不大了。
另外,公共云就是抢服务器托管的市场呗,比服务器托管更简单方便,从某个程度来说,会促进市场向移动互联网转移。是这样吧?
@gocome 大企业搞私有云,小企业应该搞基于docker的虚拟化,谈云确实拔高了。。
我反正是坚决不会上公共云的,除非严格审核他们的源码,天知道他们搞了哪些勾当。。
对了,人事考试相关的应用我也做3年了。
突然想搞个全国的人事考试的信息汇总,就是爬各地的公务员考试、事业单位考试、电力烟草银行这样的考试以及各行各业的职称考试信息汇总展示。。。
就和海投网搞招聘会汇总一样。。
有没有兴趣一起来搞?
@tracymcladdy 好啊,刚买了本Web Scraping With Python
@gocome 行啊。。然后我去干基于solr数据同步和全文检索。。晚上聊,这会还有些事。。最好3-5人一起搞,把技术选型和架构敲定了我就先去vultr搞个vps把环境搞起来。。
@tracymcladdy 睡觉去,回聊。要研究下用哪个爬虫,nutch, scrapy还是啥
好了 理一下基本想法。。
先说说我个人的想法
我的想法是算大家业余做点事,当成一个公益开源项目来搞,能盈利就都有肉吃,能走到哪一步看天,不画饼不YY,做不起来也算练技术和沟通能力同时交朋友了
不搞融资,不搞推广,不全职搞现在看见创业两个字就反感,大家现在也应该都呆的好好的,全职创业风险大,坑投资人的钱更没意思。
怎么盈利再考虑,原则上不靠广告赚钱,如果有了流量和数据,变现能力应该还是有的。
慢慢搞,有时间就搞,不影响正常生活和娱乐,都别有压力
再说打算做哪些
第一步爬数据,同步数据展示,支持全文检索,同时搭建考生交流论坛(论坛采用开源成品)
然后我想办法打点插边球,看能不能从几个省的官方人事考试机构引流考生过来。如果流量没起色,项目停止。
有流量考虑做第二步,做对考生的增值服务,买会员,做定制化考试时间提醒实现基础盈利。
万一火了考虑第三步做app,做全方位的考试服务:教材预定,培训,uber专车考场接送,外卖,酒店预定等接入
再说技术选型
原则上全部restful api,第一步只有爬虫,数据同步,全文检索,web页面展示。(注册我都不想做,功能做的足够小,足够好)
爬虫想做到支持模版规则自定义的(不要针对特定网站去特定写),能突破各种反爬手段的(如ip访问限制,验证码等)
数据原则上用mongodb吧,没有表结构处理各种爬来的不一样的数据坑少些。
搜索数据库数据和搜索引擎同步,同时搜索引擎支持全文检索。solr和mongodb的集成我有现成经验,用别的解决方案也行,学呗。
页面展示 拿json数据前台组装,响应式设计就行了,这个我是纯彩笔。
然后交流的话,咱是接地气点qq群?还是geek点搞邮件列表或者再搭个交流论坛?
讨论好了敲定了春节就开搞,敲不定就gg
@tracymcladdy 好复杂...
@cnpython 不觉得复杂啊。。就是爬数据回来保存,然后展示到页面同时支持搜索呀,别的都不弄
@tracymcladdy 人事相关还是公务员考试相关的?有点不太清楚。另外,感觉这主要是一个搜索的功能吧。爬到的内容,加上标签,做索引。其实主要是标签对URL的映射,用户可以从关键词找到对应的内容页面就行。是这样吗?
@gocome 人事考试相关的都想弄,包含公务员考试,事业单位考试,职称考试和垄断行业的考试等,其实也就是爬全国各地的人事考试网。
功能你说的不对,我的想法是爬页面数据,本地存储,处理数据提取关键字,然后套用本地的样式统一一个风格展示。
全文检索的效果可参考 http://www.jobhb.com/front/search/job/ (公司项目)
完整的效果和海投网类似 http://xyzp.haitou.cc/ (别人的产品)
@tracymcladdy 给几个考试相关的网站我先研究下
@yangpan1989 你看我叫了一个月,才有个爬虫爬过来,真要是一呼百应就好了
@gocome 确切地说,要资源!
@gocome
http://www.cpta.com.cn/ 中国人事考试网
http://www.hbsrsksy.cn/ 湖北人事考试网
http://www.zjks.com/ 浙江人事考试网
http://www.rsks.sdrs.gov.cn/default.aspx 山东人事考试网
http://www.gdrsks.gov.cn/index.asp 广东人事考试网
http://www.whptc.org/ 武汉人事考试网
最后应该要爬到所有的省市县的信息,应该超过3000个网站,所以我的想法是肯定要模板化建模来爬,关键字匹配比如只爬带有“报名”,“招聘”,“考试公告”等关键字眼的数据,然后按基本统一的格式在本地存储,以便本地用统一样式展示,你怎么看?
@tracymcladdy 看网站好乱,光是关键字应该不行,还要加些分析
@tracymcladdy 那不是跟应届生这个网站一样? 看下http://www.yingjiesheng.com/wuhan/
@tracymcladdy 可以再明确点吗?比如拿一个网页为例,这样的网页才是需要的,其它的是噪音
@tracymcladdy 有没开始搞了?我报名加入啊,算我一个!
@zhouzhe8013 @cnpython @tracymcladdy @wulien @wangpugod2003 @dimayi @yangpan1989
节后了,来不来啊?
就@tracymcladdy那个爬虫的吧,当练手也好,用python?
我觉得要分两块,一块是爬虫加搜索,scrapy做spider,然后输进solr或者elasticsearch里
还有一块就是flask带前端,一方面显示内容,另一方面做点后台管理的页面。看了一下,各家的网站都不一样,还要考虑健壮性啥的
以后还可以试试NLP,更智能一点
@gocome
@wangpugod2003
搞,建个telegram的群组去?
然后我下午把vps搞好。
@tracymcladdy 怎么样了?telegram没用过,不过看起来很不错啊
@gocome
@wangpugod2003
vps已弄好,两位提供个qq,我还是来建个qq群吧。。
@tracymcladdy 我的QQ 1343590519
微信不用吗?现在微信用得多
@tracymcladdy 我的QQ,22928048
@gocome 你的qq加不上,答案我不知道
工作用qq交流还是方便些哇
@tracymcladdy 修改了,请再试下
过早客微信公众号:guozaoke • 过早客新浪微博:@过早客 • 广告投放合作微信:fullygroup50 鄂ICP备2021016276号-2 • 鄂公网安备42018502001446号