星空捞月:找寻心中的安宁
首页
归档
分类
标签
关于
elasticsearch-vs-mongodb
原文翻译 选择Elasticsearch还是选择MongoDB,该问题我已经被许多初学者、朋友或需要作出技术架构决策的开发者问及好多次了。那么应该选择MongoDB,还是选择ElasticSearch呢?因此,这里我简短的介绍一下MongoDB与Elasticsearch的不同之处,且言明在什么场景下那个作为首要选项。我假设读者已经了解了关于MongoDB/Elasticse
2018-06-29
读书笔记
调研
ES
MongoDB
HTML全文转化为PDF技术选型研究与流行方法汇总
在实际也无需求中,需要用到网页快照功能,并能够查看历史网页快照功能,因此需要实现网页格式的固化保存,保存为图片或PDF文件的形式。
2018-06-29
Java
调研
总结
Html
PDF
Spark-RDD/DataFrame-map保存数据的两种方式
使用Spark RDD或DataFrame,有时需要在foreachPartition或foreachWith里面保存数据到本地或HDFS。
2018-06-29
大数据
Spark
使用
Crontab整点运行问题
无论是使用Linux自带crontab程序,还是使用cron-utils的crontab语法解析,都存在整点运行问题。
2018-06-29
运维
调研
问题
RSA-加密算法备忘
import java.io.UnsupportedEncodingException; import java.math.BigInteger; import java.security.InvalidKeyException; import java.security.KeyFactory; import java.security.NoSuchAlgorithmException; impo
2018-06-29
Java
备忘
Weibo单节点爬虫设计
微博目前开发数据接口,如果用于商业用途最好通过此接口来获取微博数据。作者爬去少量数据,仅用于研究学习。
2018-06-29
爬虫
设计
Phantomjs服务模式:从性能并发方面谈起
作为比较好的动态网页爬虫手段,phantomjs在许多方面令人比较满意。调用Phantomjs的方式,一般有如下几种情况。
2018-06-29
爬虫
调研
Phantomjs
JavaNLP-分词学习与研究:word分词
转载自:Java分布式中文分词组件 - word分词 Java分布式中文分词组件 - word分词
2018-06-29
深度学习
NLP
Java
分词
javaNLP-各种Java分词工具比较
转载自:Java开源项目cws_evaluation:中文分词器分词效果评估对比 中文分词器分词效果评估对比
2018-06-29
深度学习
NLP
Java
微博分析报告学习
一份微博分析报告, 本文主要将网页内容截屏为图片,主要用于学习,有兴趣的同学可以到原文微博传播效果分析
2018-06-29
读书笔记
总结
学习
1
…
4
5
6
7
8
9
搜索
×
关键词