Python爬虫技术初探
网络爬虫·
参考资料:Python爬虫教程(从入门到精通)
网络爬虫(Web Spider 又称为网页蜘蛛,网络机器人),它是一种按照一定的规则自动浏览、检索网页信息的程序或者脚本。网络爬虫能够自动请求网页,并将所需要的数据抓取下来。通过对抓取的数据进行处理,从而提取出有价值的信息。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。
Python 爬虫指的是用 Python 语言来编写爬虫程序。除了 Python 外,其他语言也可以编写,比如 Java、PHP 等,不过相比较而言,Python 更为简单和实用。一方面, Python 提供了许多可以应用于爬虫的库和模块;另一方面, Python 语法简单、易读,更适合于初学者学习,因此 Python 爬虫几乎成了网络爬虫的代名词。
学习条件:在学习爬虫技术前,您应该已经熟练掌握了 Python 基础知识,并对前端语言以及 SQL 数据库有基本掌握。当然,如果您对网络通信协议(TCP/IP 或HTTP)有一定的了解,那么对学习 Python 爬虫技术将大有裨益。
对共识算法的简单了解
共识算法·
共识算法(consensus A7M),即达成共识的过程,而非一致性算法。一致性(consistency)是终态,共识算法是达成一致性的一种实现手段和过程。
常见的共识算法有
PBFT(Practical Byzantine Fault Tolerance,实用拜占庭容错算法)
PoW(Proof of Work,工作量证明)
PoS(Proof of Stake,权益证明)
DPoS(Delegate Proof of Stake,委托权益证明)
Ripple(瑞波)
共识机制(协议)·
需要一种机制来保证区块链中的每一区块只能由一个节点来负责修改,如何选出修改数据的节点,这就是共识机制。让平等的参与者按照某种秩序达成一致意见。