-
python3遇到的中文编码问题
使用百度NLP进行文本分析时,python3中会遭遇中文编码问题,文本自身是utf8编码,但部分字符不能直接转…
-
greenplum遇到节点死锁问题
在针对一个不大的表格执行清空操作时,遇到了长时间执行且未返回结果的情况。网上搜索后,发现是遇到了死锁问题。 1…
-
evernote无法准确搜索笔记的问题
近期在使用evernote过程中,突然发现其搜索出现问题,导致搜索结果不完整,有时甚至完全搜索不到结果。 在搜…
-
在greenplum中删除重复数据
在PostgreSQL中,可以借助ctid变量删除重复数据:postgresql: 使用SQL删除重复数据,但…
-
使用window函数处理表中相邻行间类似数据
出租车轨迹数据中,有时候同一辆车会在同一个空间位置发回来很多数据,这时除了时间字段外其他字段内容都相同。为了更…
-
使用sed和awk对出租车数据进行清洗
拿到出租车数据,要做大量的数据清洗工作。里面经常有各种奇怪的错误。本文记录了使用sed和awk对出租车数据进行…
-
SQL问题:array select子查询优化
在我们的数据库中,灌入了上海出租车数据,大概有36亿条数据,开始主要的目的是测试MPP数据库性能,也顺手开展了…
-
PostgreSQL:real类型的比较
PostgreSQL的数据类型,对于小数来说,有decimal、numeric、real、double pre…
-
tmux:终端复用神器
最近链接服务器的网络变差了,经常连接不上,导致正在执行的命令中断。一番搜索后发现tmux神器,其本身是用来管理…
-
在ubuntu 16.04上安装MapD问题小结
这是一个初步的小结,记录中间所踩的坑,同时在我的服务器尚有问题未解决。 从官方的github库直接下载下来,按…
-
ubuntu 16.04 cuda 9.1源代码安装tensorflow-1.7
目前默认的pip模式安装不能支持cuda 9.1版本,因此需要在ubuntu 16.04服务器上采用源代码编译…
-
ubuntu中禁止ipv6
之前提到如何临时禁止ipv6,目前发现机房环境的ipv6基本已经瘫痪,就想长期禁止ipv6,否则在使用过程中会…