CWYAlpha

Just another WordPress.com site

Thought this was cool: 如何计算两个文档的相似度全文文档

leave a comment »

Written by cwyalpha

六月 10, 2013 at 2:38 上午

发表在 Uncategorized

Thought this was cool: 比奥数题还脑残的Python题

leave a comment »

下边的问题是在CPython interactive shell 里按顺序执行的,请在 下划线处 ____ 填上答案。

>>> x = [1, 2, 3]
>>> for number in x:
...     number += 1
... 
>>> print x
__________________
>>> print 1 == True
__________________
>>> print 0 == False
__________________
>>> print 2 == True
__________________
>>> item = 'x'
>>> print item == "y" or "z"
___________________
>>> l = [1,6,4,2,3,9,4,6]
>>> l = l.sort()
>>> print l
___________________
>>> ll = [lambda: n for n in range(5)]
>>> print [l() for l in ll]
___________________
>>> my_gen = (i for i in range(10))
>>> print(3 in my_gen)
___________________
>>> print(7 in my_gen)
___________________
>>> print(2 in my_gen)
___________________

via

from est's blog: http://blog.est.im/post/50388604760

Written by cwyalpha

六月 5, 2013 at 10:38 上午

发表在 Uncategorized

Thought this was cool: 微软到底出了什么问题

leave a comment »

最近HN上有个关于Linux 3.1内核tickless新特性的讨论,然后一位微软员工,自称来自NT内核组,发个帖子抱怨微软:

See, component owners are generally openly hostile to outside patches: if you’re a dev, accepting an outside patch makes your lead angry (due to the need to maintain this patch and to justify in in shiproom the unplanned design change), makes test angry (because test is on the hook for making sure the change doesn’t break anything, and you just made work for them), and PM is angry (due to the schedule implications of code churn). There’s just no incentive to accept changes from outside your own team. You can always find a reason to say “no”, and you have very little incentive to say “yes”.

Another reason for the quality gap is that that we’ve been having trouble keeping talented people. Google and other large Seattle-area companies keep poaching our best, most experienced developers,

More examples:
– We can’t touch named pipes. Let’s add %INTERNAL_NOTIFICATION_SYSTEM%! (Oh, and let’s make %INTERNAL_NOTIFICATION_SYSTEM% inconsistent with virtually every other named NT primitive.)
– We can’t expose %INTERNAL_NOTIFICATION_SYSTEM% to the rest of the world because we don’t want to fill out paperwork and we’re not losing sales because we only have 1990s-era Win32 APIs available publicly.
– We can’t touch DCOM. Let’s create %C#_REMOTING_FLAVOR_OF_THE_WEEK%!
– XNA. Need I say more?
– Why would anyone need an archive format that supports files larger than 2GB?
– Let’s support symbolic links (Can I have a one on my review score now?), but make sure that nobody can use them so I don’t get blamed for security vulnerabilities (Great! I got that one on my review score, and now I get to look sage and responsible!)
– We can’t touch Source Depot, so let’s hack together SDX!
– We can’t touch SDX, so let’s pretend for four releases that we’re moving to TFS while not actually changing anything!
– Oh god, the NTFS code is a purple opium-fueled Victorian horror novel that uses global recursive locks and SEH for flow control. Let’s write ReFs instead. (And hey, let’s start by copying and pasting the NTFS source code and removing half the features! Then let’s add checksums, because checksums are cool, right, and now with checksums we’re just as good as ZFS? Right? Do I get a one on my review score now? And who the hell needs quotas anyway?)
– We just can’t be fucked to implement C11 support, and variadic templates were just too hard to implement in a year. (But ohmygosh I turned “^” into a reference-counted pointer operator. Can I have my patent cube and one on my review score now? Oh, and what’s a reference cycle?)

简单的说,就是NT内核

  1. 改进都被臃肿的官僚枪毙了。
    2 牛人都去Google了
  2. 做内核的都是现招应届毕业生。造轮子NIH综合症高发群体

在大学的时候也接触过微软技术体系,感觉是有牛逼的地方,有亮点,但是偶数代会把奇数代的技术否定掉。记得有个哥们花了很大力气学习翻译了.NET Atlas AJAX,结果beta一完毕,整个AJAX体系就变得面目全非了。

微软的内部已经死掉了。Wintel 没有希望了。PC也将继续没落。

btw 想起了一幅图

from est's blog: http://blog.est.im/post/50147253283

Written by cwyalpha

六月 5, 2013 at 10:23 上午

发表在 Uncategorized

Thought this was cool: Resources about deeplearning

leave a comment »

This post is not finished. I will add more resources in future….

 

Restrict Boltzmann Machine

  1. A Practical Guide to Training Restricted Boltzmann Machines This article help you implement the RBM
  2. A Fast Learning Algorithm for Deep Belief Nets How to train deep network by stacked RBM
  3. Biasing Restricted Boltzmann Machines to Manipulate Latent Selectivity and Sparsity How to make RBM sparse so that every hidden unit can represent a simple features.
  4. Sparse deep belief net model for visual area V2 How to training the sparse RBM

RBM in Text Mining

  1. Replicated Softmax: an Undirected Topic Model This paper discuss how to use softmax activation function model multi-nominal distribution
  2. Training Restricted Boltzmann Machines on Word Observations Softmax have high time complexity. This paper discuss how to improve performance of softmax
  3. A Neural Autoregressive Topic Model This paper consider order of words in a document. Given first n – 1 words, predict the nst word. This model’s performance is good

    1. This paper’s idea comes from this page The Neural Autoregressive Distribution Estimator , this paper introduce how to convert RBM to bayesian network

Sparse Coding

The sparse coding algorithm is consist of two steps :

  1. Given basis, learning sparse representation of samples
  2. Given sparse representation of samples, learning basis

The first step is a quadratic optimization problem under L1 regularization. And this step is very time consuming. Following methods have been proposed to solve this problem:

  1. LASSO
  2. LARS
  3. Feature-Sign

Auto Encoder

Auto Encoder is a neural network which try to re-construct the input in the output layer.

您可能也喜欢:

推荐解释对推荐的重要性

用解释来增加推荐结果的多样性

一个PHP+MYSQL的搜索引擎解决方案

[Book] Monte Carlo Statistical Methods

中国地质馆

无觅

from xlvector – Recommender System: http://xlvector.net/blog/?p=888

Written by cwyalpha

五月 12, 2013 at 8:38 上午

发表在 Uncategorized

Thought this was cool: python 面试必读

leave a comment »

Python Interview Question and Answers( 面试问题与解答 ) 

原文链接: 
http://ilian.i-n-i.org/python-interview-question-and-answers/ 

总结了10道题的考试侧重点,供参考: 
1.How are arguments passed – by reference of by value? 
考的是语法,基本功,虽说python程序员可以不用关心堆栈指针那些头疼的东东,但传引用和传值的区别还是必需清楚的。 

2.Do you know what list and dict comprehensions are? Can you give an example? 
典型的pythonic用法 

3.What is PEP 8? 
是不是有良好的编码习惯 

4.Do you use virtual environments? 
是不是有独立配开发环境的能力 

5.Can you sum all of the elements in the list, how about to multuply them and get the result? 
期待你用pythonic方式解决 

6.Do you know what is the difference between lists and tuples? Can you give me an example for their usage? 
python中两种最基本常用的数据结构 

7.Do you know the difference between range and xrange? 
期待你清楚generator及其是如何使用内存的,generator用法还是典型的pythonic 

8.Tell me a few differences between Python 2.x and 3.x 
希望你对新老产品都有所关注 

9.What are decorators and what is their usage? 
典型的pythonic用法 

10.The with statement and its usage. 
典型的pythonic语法 

# 来源:豆瓣 Django 小组


在微博上关注:
新浪,
腾讯
 
投稿

最新招聘

更多>>


from python.cn(jobs, news): http://simple-is-better.com/news/1006

Written by cwyalpha

五月 8, 2013 at 8:23 上午

发表在 Uncategorized

Thought this was cool: 漫谈 HMM:Definition

leave a comment »

坊间有流传过这么一段《胡适留学日记》:

7月4日: 新开这本日记,也为了督促自己下个学期多下些苦功。先要读完手边的莎士比亚的《亨利八世》。

7月13日: 打牌。

7月14日: 打牌。

7月15日: 打牌。

7月16日: 胡适之啊胡适之!你怎么能如此堕落!先前订下的学习计划你都忘了吗?子曰:吾日三省吾身。不能再这样下去了!

7月17日: 打牌。

7月18日: 打牌。

且不论真假,突然觉得倒是很合适用来作为 Hidden Markov Model (HMM) 的例子来讲的,因为和书上课上讲的例子,天气呀遛狗啊还是马克杯啊什么的,果然还是这个比较好玩一点啊。

假设小明有很严重的拖延症,在每一天他会处于没有拖延症的正常状态 Normal、以及不同程度的拖延症 Light、Heavy 和 Critical 状态中的一种。每天的状态会随着前一天所处的状态不同而发生改变,转移方式如图 (fig: 1) 所示。

简单来说:小明一开始会处于正常状态,不过由于他拖延症非常严重,第二天毫无悬念地会进入轻度拖延症状态。在轻度拖延症状态中有很大的概率 (0.7) 会进入重度拖延症状态或者以 0.3 的概率维持在轻度拖延症状态中。一旦进入到重度拖延症状态,他会以 0.8 的概率一直保留在那个状态,或者有比较小的几率 (0.2) 进入致命拖延状态。在致命拖延状态中度过一天之后小明会幡然醒悟,下定决心重新做人,并在第二天成功回复正常状态。然后……周而复始、世袭罔替……

1图 1    小明的拖延症状态转移图

不过,小明的拖延症状态是隐藏在他大脑里的(这也是 HMM 中 Hidden 的由来),他自己也搞不清楚。但是我们知道他在不同的状态下会做什么样的事情。

小明在不同状态下打牌的概率
状态 打牌的概率 不打牌的概率
Normal 0 1
Light 0.3 0.7
Heavy 0.8 0.2
Critical 1 0

虽然我们没法把小明的脑袋打开看看里面的寄存器是什么状态,但是我们可以偷看小明的日记观察小明的日常生活。通过这些历史数据,我们可以做这样一些事情:

  • 给定小明某一段时间的日记(打牌、不打牌),计算该日记是否是伪造的概率。更确切地说,计算该日记所记录的日常生活是来自于小明的拖延症模型的概率。
  • 给定小明某一段时间的日记,推断出每一天小明最有可能处在什么状态。

另外,如果我们并不事先知道小明的拖延症模型(状态转移和不同状态下的行为),如果有足够多的历史数据(日记),我们还可以做的第三件事情就是:

  • 估计小明的拖延症模型参数。

这三件事正好对应了 HMM 中的三个任务,分别是 Scoring、Matching (或者 Decoding)、Traing (或者 Learning)。对应这三个任务分别有三个算法:

熟悉 Graphical Model 的同学肯定一下子能看出来,前两个问题属于 Inference 问题,分别就是算 Marginal 和 MAP 推断;而最后一个问题则是 Learning 问题,之所以 EM 算法也是因为状态是没有观察到的隐变量。由于三个问题都定义得非常清楚,而且也有非常高效的算法进行计算,加之 HMM 模型的适用范围非常广,所以在诸如语音识别、自然语言处理、机器翻译、基因序列对齐、机器人定位等等各种各样的应用中得到广泛采用。虽然它提出来也已经有相当年头了,并且也有自己的局限和问题,但是,比如说,现在的 state-of-the-art 的语音识别系统仍然主要是基于 HMM 框架的。

具体来说,HMM 可以定义为一个三元组 \(\pi,A,B\)。其中 \(\pi\) 用于描述初始状态的分布,在小明的例子里初始状态是 deterministic 地位于Normal状态的,General 的 HMM 并不要求这样。\(A\) 则是状态转移矩阵,\(a_{ij}\) 表示在 \(t\) 时刻处于状态 \(s_i\) 的情况下,\(t+1\) 时刻转移到状态 \(s_j\) 的概率:

\[
a_{ij} = \mathbb{P}(q_{t+1}=s_j|q_{t}=s_i)
\]

注意 \(t+1\) 时刻的状态分布只依赖于 \(t\) 时刻的状态,而与更之前的状态无关 (independent)11更确切地说,是 \(q_{t+1}\) 在给定了 \(q_t\) 的情况下与更早的 \(q_{t-1}\) 等状态无关,亦即是 Conditional Independence。条件独立性是 Graphical Model 里的核心概念。下面关于观察值的独立性类似。,这类的性质通常叫做 Markov Property,这也是为什么 HMM 叫做Markov Model的原因。除了状态有这个性质之外,每个时刻所得到的观察值也有类似的性质:\(t\) 时刻的观察值(打牌还是不打牌)\(o_t\) 只依赖于 \(t\) 时刻的状态 \(q_t\),并由三元组中的 \(B\) 来决定,具体来说

\[
b_{ij} = \mathbb{P}(o_t = v_j|q_t = s_i)
\]

对于小明的例子,我们实际上是用状态转移图来给出了 \(A\) 和 \(\pi\),并用表格的形式给出了 \(B\)。由于 HMM 总是对应一个 sequence (的状态或者观察值),所以另一个非常常见的 HMM 的表达方式是用每个时刻 \(t\) 的对应的状态 \(q_t\) 和观察值 \(o_t\) 的随机变量的 Graphical Model 来表示,例如我们直接从 Wikipedia 上盗用一个图(它这里用 \(x\) 表示状态,\(y\) 表示观察值):

从这个 Graphical Model 上能更加清楚地看出各个随机变量之间的条件独立性,也就是 Markov 性质。不过不要忘记的是在这个图模型中每个横向箭头所对应的转移概率函数全都是一样的,同样,纵向箭头所对应的观察值生成概率分布也是所有时刻公用的。

最后,假设胡适先生上面的日记日期是连续的话,我用 Viterbi 算法算了一下,最可能的状态 sequence 是:他进入了重度拖延症状态之后就再也没能出来过。^_^bb 嘛,也许是模型参数设得不够好呢?

注:由于现在越来越忙,长篇大论的博客能写出来的频率也越来越低,为了让 blog 不止于荒废掉,我决定尝试着写一些比较短的文章,在需要的情况下把一些长文分成系列文章分期完成。当然风险就是有可能烂尾,不过写出一部分来似乎也总比整个憋不出来要好啊?^_^bb 所以,关于 HMM 的三种算法的细节以及相关的应用的介绍之类的,就下次再说了。

from Free Mind: http://freemind.pluskid.org/machine-learning/hmm-definition/

Written by cwyalpha

五月 8, 2013 at 8:23 上午

发表在 Uncategorized

Thought this was cool: 为什么在12306买火车票要装根证书?

leave a comment »

  12306主页上有一段很显眼的文字—–“为保障您顺畅购票,请下载安装根证书。”这段文字和12306很多的其他问题一起成为网友诟病12306的话题,但是这个看似安全的根证书确可能会成为让12306用户们的安全受到严重威胁的东西。

  为什么在12306上买火车票要装根证书?想要回答这个问题,那么我们就必须先要提前回答说几个定义:

  电脑在与服务器交换敏感信息时会使用一种叫做SSL的加密方式。在很多情况下,交换敏感信息必须要通过这个方式来进行。包括12306在内,淘宝、京东等在交换敏感信息的时候都使用了SSL进行加密。

  那么,我们怎么知道网站是否使用了SSL加密呢?最简单的办法就是看看地址栏——如果网址前面写的是“https://”,那么这个页面就是使用SSL加密的。这意味着你访问的页面是安全的并且可以用来交换敏感信息。如果你使用的是Internet Explorer 7或者以上版本浏览器,你应该能在浏览器地址栏的最右边看到一把小锁头。就像下图所示的那样。点开这把小锁头,就能看到关于https的信息。

为什么在12306上买火车票要装根证书

  用其他浏览器呢?现在流行的浏览器中,全部都会标示出来该网页是使用了https以防止窃听和用户的个人信息安全的。比如下边的图就是在Firefox中使用https浏览维基百科的画面。

为什么在12306上买火车票要装根证书

  但是,谁又能保证https的安全呢?这里就又是一个概念:数字证书认证机构。它的译名很多,不过大致意思对就可以了。英文Certificate Authority,经常被缩写为CA。下文中也使用“CA”来称呼数字证书认证机构。

  CA是一个机构——打个比方,这就像是信用卡一样。一个人向银行申请信用卡,就像网站向CA申请证书。CA觉得网站的信用合格,就签发SSL证书;银行觉得申请者的信用合格,就签发信用卡。等等,什么又是“SSL证书”呢?这就是CA签发给网站用以证明网站身份的“信用卡”。有了SSL证书,加密网页才能被信任。当你在访问一个被https加密的网页时,网页会出示一份证书,这份证书有助于用户信任这个网站。没有正规CA签发的证书的网站是不会受到浏览器的信任的——就算你用了SSL来加密也没用。

  再看看前面的两张图片。第一章支付宝的截图中,CA就是:VeriSign Class 3 Public Primary Certification Authority – G5

  第二章维基百科的截图中,CA是:DigiCert Inc

  浏览器又上哪知道CA是正规的呢?那就是根证书库,这是一个操作系统认为可以被信任的CA的名单。几乎每个能上网操作系统(甚至包括诺基亚最弱智的S40系统)都有一个。在这里用Mac做示例。Mac的根证书库在:

  Finder-应用程序-其他(提示:OS X Lion或者以下操作系统叫“实用工具”)-钥匙串访问

  然后在最左边找“系统根证书”,点进去便是。看到的应该如下图所示。

为什么在12306上买火车票要装根证书

  可以试着找一下VeriSign Class 3 Public Primary Certification Authority – G5—–肯定能找到!每次浏览器浏览https网页时,都会把网站出示的证书在这个库里面找一圈,能找到就OK,找不到的话,就证明你这个CA是不可靠的!

  SSL加密的目的除了保证用户信息在传输过程中的安全外,还保障了服务器的身份。有些简单的SSL证书仅仅需要用该网站域名的邮箱向CA发封邮件就能签发了——不过如果是一个组织、团体、基金会或者盈利性机构(尤其是类似于支付宝或者PayPal的网络支付服务),那么SSL证书的签发就会变得十分繁琐。网站需要提供大量的文件以证明该网站是可靠的。如果能够证明该网站是可靠的,CA才会给签发证书。

  还有一种证书被称作EV SSL证书(Extended Validation SSL),这种证书遵循全球统一的严格身份验证标准颁发的SSL证书,是目前业界最高安全级别的SSL证书。这种证书显示起来,就是俗称的绿色地址栏证书。在IE 7和以上IE浏览器便会出现绿色地址栏,并且滚动展示该网站的信息和CA信息。如下图所示。

为什么在12306上买火车票要装根证书

  EV SSL的申请手续更复杂,申请费用也更多,但是可以换来更多用户的信任。左图是Firefox下显示EV SSL证书的样子。这个证书证明了这个网站的经营者为Wikimedia Foundation, Inc.,并且位置位于San Francisco California, US

  据一个叫做VeriSign的CA的统计,使用EV SSL能大幅提升用户对于网站的信任。

为什么在12306上买火车票要装根证书

  总而言之,SSL证书的目的有两个:

  • 确保网站和用户之间的数据是加密并且可靠的
  • 确保网站所宣称身份的真实可靠

  如果访问12306.cn会出现什么情况呢?12306的确使用了SSL来加密以保障网页的安全,而访问直接访问12306就算不安装根证书也不会出现任何问题。以Chrome为例,访问主页不会出现任何问题,但是若要访问购票页面就会无法访问,如下图所示。

为什么在12306上买火车票要装根证书

  12306会让我们访问一个叫https://dynamic.12306.cn/otsweb的网址。如果我们直接用Chrome访问这个网址呢?华丽丽的一幕出现了:

为什么在12306上买火车票要装根证书

  使用IE8浏览这个页面会出现这样:

为什么在12306上买火车票要装根证书

  回到Chrome,如果我们点击“仍然继续”,就会正常的看到购票页面没有任何阻力。IE8也是一样,不过IE8的地址栏整个都会变成红色的。

  如果我们点击旁边的小锁头来查看关于这个证书的信息呢?会出现下图。

为什么在12306上买火车票要装根证书

  再点击“证书信息”,会看到这个12306的证书是一个叫做SRCA的CA签发的。

为什么在12306上买火车票要装根证书

  但是在“钥匙串访问”里面根本没有一个叫做SRCA的CA。

  如果安装上了首页给出的“根证书”,(依然以Mac为例)钥匙串访问里面就会有一个叫做“SRCA”的CA!并且本来这个证书是不受信任的,安装之后就会被设置为“此证书已被标记为受此账户信任”。

为什么在12306上买火车票要装根证书

  这样的话,浏览器和操作系统就会信任这个证书,便不会给予CA信息不对的提示了。

  “SRCA”又是何许人也?在上图中,可以看到SRCA的细节部分,“组织”填写的是Sinorail Certification Authority

  这也就不难分析了,“Sinorial”中的“S”和“R”,“Certification Authority”的“S”和“A”,就拼出来了“SRCA”。

  在搜索引擎中搜索Sinorail Certification Authority中的Sinorail,就会找到这样一个网站。叫做“中铁信息工程集团”。网址就是http://www.sinorail.com/。

  听名字就知道这网站跟12306肯定是亲戚关系。换种话说,就是自己给自己发证书。你说这证书能可信吗?

  正规CA的证书可不是白给的。要不然CA靠什么吃饭?一个SSL证书从每年三百块RMB到一万五不等。据我所知,最贵的证书是VeriSign签发的,一万五的那个就是他。而便宜的三百块证书——只要不是VeriSign,其他CA签出来的最便宜的证书差不多都这个价。比较便宜的代表是Go Daddy、Comodo等。为什么12306要使用自己给自己的证书呢?貌似唯一的合理解释就是省钱。能省大概三百到一万五不等。

  铁道部有时候买一张火车票就差不多够一年的证书钱了。

  那么又为什么说铁道部用自己的证书不安全呢?有些人在12306上买票时会看到“该站点安全证书的吊销信息不可用,是否继续”的提示语,这又是什么意思呢?

  从前有个倒霉的的荷兰CA,叫DigiNotar。这CA被黑客攻破,导致这家CA办法给一些用户的证书的私钥失效(私钥是在SSL加密环节中非常重要的东西),这就使得以这家CA的名义伪造证书成了可能。黑客可以通过这家公司的名义伪造证书给一些非法网站,客户一看这是加密过的还是大型CA签出来的证书便很容易信任。因为DigiNotar名气很大,并且很多大公司都使用它的证书,微软等操作系统厂商在这事情发生之后开始忙不迭的发布更新补丁来宣布DigiNotar的证书失效。

  微软在 KB2607712 补丁中宣布了DigiNotar的根证书无效。原文如下:

Microsoft 已获悉 DigiNotar 颁发了至少一个虚假数字证书,DigiNotar 是受信任的根证书颁发机构存储区中出现的一个证书颁发机构。虚假证书可能用于哄骗内容、执行网页仿冒攻击或者针对所有 Web 浏览器用户(包括 Internet Explorer 用户)执行中间人攻击。虽然这不是 Microsoft 产品中的一个漏洞,但是此问题会影响 Microsoft Windows 的所有受支持版本。

  这家倒霉公司最后因为这件事华丽丽的破产了。

  正如这件事一样,有些知名CA出了事,微软这些系统厂商会忙不迭的发布补丁来宣布该CA的根证书失效——有些小CA,尤其是“SRCA”这样貌似只给12306.cn一个网站签证书的CA,人还懒得管你呢!那么小CA的私钥失窃之后会有什么不就措施呢?那就是证书吊销列表,英文全称Certificate revocation list,简称CRL。下文也称呼它为CRL。更详细的内容可以参考这里这里(英文)

  CRL是干什么的呢?比如你买的证书被盗了,只要将信息报告给CA,那么CA就会把你这个证书的信息添加到这个CA的CRL中,每次浏览器浏览加密网页时,都会检索CRL信息——如果没有的话,就会提示该站点安全证书的吊销信息不可用,是否继续。想必读到这里大家也都知道了,12306的证书没有CRL信息。这也就意味着,12306所使用的证书一旦失窃,系统厂商不会管这个,甚至连最后一根救命稻草CRL都没有。

  简而言之,如果证书出了事,两种解决办法:

  • 系统厂商发补丁宣布该证书失效
  • 通过CRL宣布证书失效

  不过可惜的是12306出了事,这两招哪一个都不顶用。

  如果证书失窃,会有什么后果?最可能的后果就是像前面的倒霉蛋一样倒闭。不过我大天朝铁道部(尽管已经倒闭)欠了两千多亿还巍然不动,这个可能便没有了。前面提到的两种解决方案一个也用不了,这就意味着遭殃的一定是用户。证书失窃,任何人都能用此来伪造虚假证书。尽管SRCA颁发的证书默认是不受到系统信任的,但是中国这么多去过12306网站买过火车票的人——假设所有人都安装了这个根证书使的系统对此证书信任——一个绿色地址栏都能提升用户这么大的信任,违法网站只要获得了SRCA颁发的证书,岂不就能轻易骗得用户的信任?

  如果你是Mac用户,并且访问https://www.12306.cn没有任何障碍,那么可以参考这个视频中的步骤来将SRCA的证书设为不信任。如果要购票,反其道而行之即可。

  从证书的角度看,中国很多大佬都做的非常不到位。比如我手里的建行网银,在安装U盾的时候必须安装一个网银根证书。SSL证书方面中国也做的很不到位。比如京东只有在用户登陆的时候才用了SSL来加密,而京东甚至在下订单的时候依然是明文传输。新浪微博在更改个人敏感信息时仍然使用明文传输,而twitter在早期甚至连微博内容都用https。如果使用不加密的公共Wi-Fi的话,那么在同一个Wi-Fi热点下有一个黑客,黑客便可以非常轻松的窃取到你的个人信息。

  P.S.:现在12306在付款的过程中使用了VeriSign签发的合格的证书,但是这样并不代表着上面所说的可能造成的严重影响不会发生。

  EV SSL介绍:http://www.wosign.com/EVSSL/index.htm

  这个地址打开后便可以看到EV SSL的效果:https://www.evssl.cn/en/

  HTTPS – 维基百科:https://zh.wikipedia.org/wiki/Https

  来源:techyan投稿,原文链接

评论《为什么在12306买火车票要装根证书?》的内容…

相关文章:

微博:新浪微博腾讯微博
QQ群:186784064
月光博客投稿信箱:williamlong.info(at)gmail.com
Created by William Long http://www.williamlong.info
from 月光博客: http://www.williamlong.info/archives/3461.html

Written by cwyalpha

五月 8, 2013 at 8:08 上午

发表在 Uncategorized

关注

每发布一篇新博文的同时向您的邮箱发送备份。