作者文章归档:seraphln

修改django admin里的时间显示格式


在使用Django Admin做一些业务系统时发现它默认的时间格式是类似于:

May 8, 2020, 11:55 a.m.

这对于一般的客户来说,读起来有点麻烦。所以经常会收到反馈是希望有一个易读性更强的时间字段。实现方法很简单,可以这样:

在ModelAdmin中,添加一个新的时间方法,例如:

def formated_time(self, obj):
    return obj.timefield.strftime("%Y-%m-%d %H:%M:%S")

然后指定它对应的ORM中的字段以及字段的说明:

formated_time.admin_order_field = 'tim...

Read more

解决MacOS: certificate verify failed: unable to get local issuer certificate的问题


最近将工作的操作系统从Ubuntu切换到了MacOS。在运行爬虫脚本时,如果抓取HTTP的页面,则没有报错,但是当遇到HTTPS页面时,就出现了这么一个报错:

certificate verify failed: unable to get local issuer certificate (_ssl.c:1045)

出现这个问题的原因是给这个网站的签发证书的CA证书没有在操作系统的root证书列表里。这里有2个可能:

  1. 证书是自签名证书(类似于之前的12306)
  2. CA是一个新的CA,操作系统里没有更新对应的CA证书

对于这个问题可以有2个解决办法:

  1. 在脚本中不校验服务端证书有效性;...

Read more

基金的选择


开扒基金家族

基金可以按四个维度来分类,按投资品种分、按交易渠道分、按运作方式分,按投资方式分。

注意:这四个方法并不是相互独立,而是各有交叉的,同一只基金在不同的分类标准下属于不同的类型。

按投资品种分

货币基金

货币基金用来投资企业债、银行定期存款、地方政府债、国债,比较安全相对收益也比交低,一般在2%-4%左右。

注意:没有投资债券占比要求,除了投资一年内的债券,还可以投资银行定期存款等其它收益比较稳定的有价证券。

货币基金的筛选方法:

  • 收益率:可以通过‘每万份收益’和‘7日年化’这两个指示。
  • 流动性:最好随用随取(T+0)。
  • 成立时间:成立时间3-5年以上比较好。
  • 基金规模...

Read more

使用scikit实现回归


scikit-learn是一个由Python开发的免费开源机器学习库,它提供了现成的功能来实现诸如线性回归分类器、SVM、k-means和神经网络等多种算法,以及一些可以直接用于训练和测试的样本数据集。是目前机器学习应用程序中使用最广泛的库之一。

安装scikit

可以直接使用pip进行安装:

pip install scikit-learn

什么是学习

学习就是人类通过观察、积累经验,掌握某项技能或能力。就好像我们从小学习识别字母、认识汉字,就是学习的过程。而机器学习(Machine Learning),顾名思义,就是让机器(计算机)也能向人类一样,通过观察大量的数据和训练,发现事物规...

Read more

NumPy和Pandas


NumPy和Pandas都是用Python做数据处理时非常好用的库。在一个新同学要使用Python做数据分析处理时,通常都会被推荐使用NumPy和Pandas这2个库。

Numpy提供了很多方便统计计算的功能,比如计算均值(mean函数)和标准差(std函数)。NumPy支持向量计算,例如向量加法、与标量相乘等。而Pandas则更进一步,它是基于NumPy开发的数学分析工具,是为了解决数据分析任务而开发的,用来存储和处理大型矩阵,比Python自身的嵌套列表结构要高效、方便很多。

一维数组

既然要做数据分析,那就不能只是分析单个数据了,所以从一维数组的数据分析开始。在NumPy中,一维数...

Read more

Alpha策略


Alpha策略是比较常见的量化策略。

Alpha的含义

Rs = α + Rf + βs(Rm + Rf) + ε

其中 Rs为现货组合的预期收益率, Rf为无风险利率,Rm为市场指数的预期收益,ε为误差项,α衡量了非系统性风险,βs衡量了系统性风险。

Alpha和Beta的关系

市场上常见的指数基金表现为: 如果整个市场涨了,业绩也跟着涨,但如果整个市场跌了,业绩也跟着跌。这是因为它的Beta系数一般在1左右,所以它的收益主要来源于Beta。

但是,如果只是依靠β来获利,那在市场走下坡时,就没有办法做到盈利了。因此我们需要更多考虑alpha参数,使得即使在市场下行时,也能获得正的超额收...

Read more

什么是量化交易


严格来讲,量化交易是运营复杂的统计学方法和数学模型,从庞大的历史数据中海选出能够带来收益的多种"大概率"事件以找出规律、制定策略,并且能用数据模型验证、固化这些规律和策略,然后用计算机来严格、高效地执行。

这一定义涉及统计学、金融学和计算机科学等多门学科,通俗点来说,量化交易是指利用统计学、数学、计算机技术和现代的金融理论来辅助投资者更好地盈利。这些量化的方法可用于分析海量历史数据,也可以用来控制持仓大小、进行风险评估、控制等。

因此,量化交易与传统的主观交易并不是二元对立,量化交易也包含主观交易,比如常见的期货跨市套利策略、期权波动率套利等就属于半自动交易。它们需要交易员综合历史均值回...

Read more

restful API的一些设计思路


什么是restful API

REST全称是Representational State Transfer,中文意思是表述(编者注:通常译为表征)性状态转移。 它首次出现在2000年Roy Fielding的博士论文中,Roy Fielding是HTTP规范的主要编写者之一。 他在论文中提到:"我这篇文章的写作目的,就是想在符合架构原理的前提下,理解和评估以网络为基础的应用软件的架构设计,得到一个功能强、性能好、适宜通信的架构。REST指的是一组架构约束条件和原则。" 如果一个架构符合REST的约束条件和原则,我们就称它为RESTful架构。

REST本身并没有创造新的技术、组件或服务,...

Read more

使用filebeat收集k8s集群中的应用日志


最近有一个新的k8s集群上线,在日志收集组件上有2个选择:

1. Logstash
2. Filebeat

logstash是之前用过的日志收集工具,同时logstash的生态也很丰富,大量的插件可以保证它在大部分的场景下都能游刃有余。但是logstash也有它的问题,典型的问题就是性能比较差以及对资源的使用较多;

filebeat则是组内同事推荐,相比于logstash,filebeat很年轻,所以功能比较单一。但是也因为功能单一,所以它相对很健壮,同时对于资源的使用也比较小。

最后考虑到新的集群硬件资源有限,所以决定选择filebeat作为该集群的日志收集组件。

方案选择

在kube...

Read more

做一个既"慢"又"懒"的研发


我们组有一条principle是: slow is fast(慢就是快)

最近在给组里的一些新同学review代码的时候发现他们在工作时有一些很明显的优缺点:

  • 优点是他们学习、编码的能力都很不错,对于每一个新的需求都能快速快成;
  • 缺点是经常会在他的代码中发现一些非常低级又很小的错误,比如单词拼写错误、又或者忘记了核心逻辑中的异常处理等等;

每次看到这样的问题,我都会跟他们说,你要学着让自己"慢"下来。众所周知,在软件工程中,有一个名词叫做:PONC(Price of Nonconformance)是指由于没有第一次做对而造成财物的额外浪费。简称:质量成本。对应到一个功能,在不同的阶段...

Read more