摘要:上一篇文章網絡爬蟲實戰數據存儲非關系型數據庫存儲下一篇文章網絡爬蟲實戰數據爬取是一個基于內存的高效的鍵值型非關系型數據庫,存取效率極高,而且支持多種存儲數據結構,使用也非常簡單,在本節我們介紹一下的操作,主要介紹這個庫的用法。
上一篇文章:Python3網絡爬蟲實戰---33、數據存儲:非關系型數據庫存儲:MongoDB
下一篇文章:Python3網絡爬蟲實戰---35、 Ajax數據爬取
Redis 是一個基于內存的高效的鍵值型非關系型數據庫,存取效率極高,而且支持多種存儲數據結構,使用也非常簡單,在本節我們介紹一下 Python 的 Redis 操作,主要介紹 RedisPy 這個庫的用法。
1. 準備工作在本節開始之前請確保已經安裝好了 Redis 及 RedisPy庫,如果要做數據導入導出操作的話還需要安裝 RedisDump,如沒有安裝可以參考第一章的安裝說明。
2. Redis、StrictRedisRedisPy 庫提供兩個類 Redis 和 StrictRedis 用于實現Redis 的命令操作。
StrictRedis 實現了絕大部分官方的命令,參數也一一對應,比如 set() 方法就對應 Redis 命令的 set 方法。而Redis 是 StrictRedis 的子類,它的主要功能是用于向后兼容舊版本庫里的幾個方法,為了做兼容,將方法做了改寫,比如 lrem() 方法就將 value 和 num 參數的位置互換,和Redis 命令行的命令參數不一致。
官方推薦使用 StrictRedis,所以本節我們也用 StrictRedis類的相關方法作演示。
3. 連接Redis當前在本地我已經安裝了 Redis 并運行在 6379 端口,密碼設置為 foobared。
那么可以用如下示例連接 Redis 并測試:
from redis import StrictRedis redis = StrictRedis(host="localhost", port=6379, db=0, password="foobared") redis.set("name", "Bob") print(redis.get("name"))
在這里我們傳入了 Redis 的地址,運行端口,使用的數據庫,密碼信息。在默認不傳的情況下,這四個參數分別為 localhost、6379、0、None。現在我們聲明了一個StrictRedis 對象,然后接下來調用了 set() 方法,設置一個鍵值對,然后在將其獲取打印。
運行結果:
b"Bob"
這樣就說明我們連接成功,并可以執行 set()、get() 操作了。
當然我們還可以使用 ConnectionPool 來連接,示例如下:
from redis import StrictRedis, ConnectionPool pool = ConnectionPool(host="localhost", port=6379, db=0, password="foobared") redis = StrictRedis(connection_pool=pool)
這樣的連接效果是一樣的,觀察源碼可以發現 StrictRedis內其實就是用 host、port 等參數又構造了一個 ConnectionPool,所以我們直接將 ConnectionPool 當參數傳給 StrictRedis 也是一樣的。
另外 ConnectionPool 還支持通過 URL 來構建,URL 的格式支持如下三種:
redis://[:password]@host:port/db rediss://[:password]@host:port/db unix://[:password]@/path/to/socket.sock?db=db
這三種 URL 分別表示創建 Redis TCP 連接、Redis TCP+SSL 連接、Redis Unix Socket 連接,我們只需要構造上面任意一種連接 URL 即可,其中 password 部分如果有則可以寫,沒有可以省略,下面我們再用URL連接演示一下:
url = "redis://:foobared@localhost:6379/0" pool = ConnectionPool.from_url(url) redis = StrictRedis(connection_pool=pool)
在這里我們使用了第一種連接字符串進行連接,我們首先聲明了一個 Redis 連接字符串,然后調用 from_url() 方法創建一個 ConnectionPool,然后將其傳給 StrictRedis 即可完成連接,所以使用 URL 的連接方式還是比較方便的。
4. Key 操作在這里主要將 Key 的一些判斷和操作方法做下總結:
方法 | 作用 | 參數說明 | 示例 | 示例說明 | 示例結果 |
---|---|---|---|---|---|
exists(name) | 判斷一個key是否存在 | name: key名 | redis.exists("name") | 是否存在name這個key | True |
delete(name) | 刪除一個key | name: key名 | redis.delete("name") | 刪除name這個key | 1 |
type(name) | 判斷key類型 | name: key名 | redis.type("name") | 判斷name這個key類型 | b"string" |
keys(pattern) | 獲取所有符合規則的key | pattern: 匹配規則 | redis.keys("n*") | 獲取所有以n開頭的key | [b"name"] |
randomkey() | 獲取隨機的一個key | randomkey() | 獲取隨機的一個key | b"name" | |
rename(src, dst) | 將key重命名 | src: 原key名 dst: 新key名 | redis.rename("name", "nickname") | 將name重命名為nickname | True |
dbsize() | 獲取當前數據庫中key的數目 | dbsize() | 獲取當前數據庫中key的數目 | 100 | |
expire(name, time) | 設定key的過期時間,單位秒 | name: key名 time: 秒數 | redis.expire("name", 2) | 將name這key的過期時間設置2秒 | True |
ttl(name) | 獲取key的過期時間,單位秒,-1為永久不過期 | name: key名 redis.ttl("name") | 獲取name這key的過期時間 | -1 | |
move(name, db) | 將key移動到其他數據庫 | name: key名 db: 數據庫代號 | move("name", 2) | 將name移動到2號數據庫 | True |
flushdb() | 刪除當前選擇數據庫中的所有key | flushdb() | 刪除當前選擇數據庫中的所有key | True | |
flushall() | 刪除所有數據庫中的所有key | flushall() | 刪除所有數據庫中的所有key | True |
Redis 中存在最基本的鍵值對形式存儲,用法總結如下:
方法 | 作用 | 參數說明 | 示例 | 示例說明 | 示例結果 |
---|---|---|---|---|---|
set(name, value) | 給數據庫中key為name的string賦予值value | name: key名 value: 值 | redis.set("name", "Bob") | 給name這個key的value賦值為Bob | True |
get(name) | 返回數據庫中key為name的string的value | name: key名 | redis.get("name") | 返回name這個key的value | b"Bob" |
getset(name, value) | 給數據庫中key為name的string賦予值value并返回上次的value | name: key名 value: 新值 | redis.getset("name", "Mike") | 賦值name為Mike并得到上次的value | b"Bob" |
mget(keys, *args) | 返回多個key對應的value | keys: key的列表 | redis.mget(["name", "nickname"]) | 返回name和nickname的value | [b"Mike", b"Miker"] |
setnx(name, value) | 如果key不存在才設置value | name: key名 | redis.setnx("newname", "James") | 如果newname這key不存在則設置值為James | 第一次運行True,第二次False |
setex(name, time, value) | 設置可以對應的值為string類型的value,并指定此鍵值對應的有效期 | name: key名 time: 有效期 value: 值 | redis.setex("name", 1, "James") | 將name這key的值設為James,有效期1秒 | True |
setrange(name, offset, value) | 設置指定key的value值的子字符串 | name: key名 offset: 偏移量 value: 值 | redis.set("name", "Hello") redis.setrange("name", 6, "World") | 設置name為Hello字符串,并在index為6的位置補World | 11,修改后的字符串長度 |
mset(mapping) | 批量賦值 | mapping: 字典 | redis.mset({"name1": "Durant", "name2": "James"}) | 將name1設為Durant,name2設為James | True |
msetnx(mapping) | key均不存在時才批量賦值 | mapping: 字典 | redis.msetnx({"name3": "Smith", "name4": "Curry"}) | 在name3和name4均不存在的情況下才設置二者值 | True |
incr(name, amount=1) | key為name的value增值操作,默認1,key不存在則被創建并設為amount | name: key名 amount:增長的值 | redis.incr("age", 1) | age對應的值增1,若不存在則會創建并設置為1 | 1,即修改后的值 |
decr(name, amount=1) | key為name的value減值操作,默認1,key不存在則被創建并設置為-amount | name: key名 amount:減少的值 | redis.decr("age", 1) | age對應的值減1,若不存在則會創建并設置為-1 | -1,即修改后的值 |
append(key, value) | key為name的string的值附加value | key: key名 | redis.append("nickname", "OK") | 向key為nickname的值后追加OK | 13,即修改后的字符串長度 |
substr(name, start, end=-1) | 返回key為name的string的value的子串 | name: key名 start: 起始索引 end: 終止索引,默認-1截取到末尾 | redis.substr("name", 1, 4) | 返回key為name的值的字符串,截取索引為1-4的字符 | b"ello" |
getrange(key, start, end) | 獲取key的value值從start到end的子字符串 | key: key名 start: 起始索引 end: 終止索引 | redis.getrange("name", 1, 4) | 返回key為name的值的字符串,截取索引為1-4的字符 | b"ello" |
List,即列表。Redis 還提供了列表存儲,列表內的元素可以重復,而且可以從兩端存儲,用法總結如下:
方法 | 作用 | 參數說明 | 示例 | 示例說明 | 示例結果 |
---|---|---|---|---|---|
rpush(name, *values) | 在key為name的list尾添加值為value的元素,可以傳多個 | name: key名 values: 值 | redis.rpush("list", 1, 2, 3) | 給list這個key的list尾添加1、2、3 | 3,list大小 |
lpush(name, *values) | 在key為name的list頭添加值為value的元素,可以傳多個 | name: key名 values: 值 | redis.lpush("list", 0) | 給list這個key的list頭添加0 | 4,list大小 |
llen(name) | 返回key為name的list的長度 | name: key名 | redis.llen("list") | 返回key為list的列表的長度 | 4 |
lrange(name, start, end) | 返回key為name的list中start至end之間的元素 | name: key名 start: 起始索引 end: 終止索引 | redis.lrange("list", 1, 3) | 返回起始為1終止為3的索引范圍對應的list | [b"3", b"2", b"1"] |
ltrim(name, start, end) | 截取key為name的list,保留索引為start到end的內容 | name:key名 start: 起始索引 end: 終止索引 | ltrim("list", 1, 3) | 保留key為list的索引為1到3的元素 | True |
lindex(name, index) | 返回key為name的list中index位置的元素 | name: key名 index: 索引 | redis.lindex("list", 1) | 返回key為list的列表index為1的元素 | b"2" |
lset(name, index, value) | 給key為name的list中index位置的元素賦值,越界則報錯 | name: key名 index: 索引位置 value: 值 | redis.lset("list", 1, 5) | 將key為list的list索引1位置賦值為5 | True |
lrem(name, count, value) | 刪除count個key的list中值為value的元素 | name: key名 count: 刪除個數 value: 值 | redis.lrem("list", 2, 3) | 將key為list的列表刪除2個3 | 1,即刪除的個數 |
lpop(name) | 返回并刪除key為name的list中的首元素 | name: key名 | redis.lpop("list") | 返回并刪除名為list的list第一個元素 | b"5" |
rpop(name) | 返回并刪除key為name的list中的尾元素 | name: key名 | redis.rpop("list") | 返回并刪除名為list的list最后一個元素 | b"2" |
blpop(keys, timeout=0) | 返回并刪除名稱為在keys中的list中的首元素,如果list為空,則會一直阻塞等待 | keys: key列表 timeout: 超時等待時間,0為一直等待 | redis.blpop("list") | 返回并刪除名為list的list的第一個元素 | [b"5"] |
brpop(keys, timeout=0) | 返回并刪除key為name的list中的尾元素,如果list為空,則會一直阻塞等待 | keys: key列表 timeout: 超時等待時間,0為一直等待 | redis.brpop("list") | 返回并刪除名為list的list的最后一個元素 | [b"2"] |
rpoplpush(src, dst) | 返回并刪除名稱為src的list的尾元素,并將該元素添加到名稱為dst的list的頭部 | src: 源list的key dst: 目標list的key | redis.rpoplpush("list", "list2") | 將key為list的list尾元素刪除并返回并將其添加到key為list2的list頭部 | b"2" |
Set,即集合。Redis 還提供了集合存儲,集合中的元素都是不重復的,用法總結如下:
方法 | 作用 | 參數說明 | 示例 | 示例說明 | 示例結果 |
---|---|---|---|---|---|
sadd(name, *values) | 向key為name的set中添加元素 | name: key名 values: 值,可為多個 | redis.sadd("tags", "Book", "Tea", "Coffee") | 向key為tags的set中添加Book、Tea、Coffee三個內容 | 3,即插入的數據個數 |
srem(name, *values) | 從key為name的set中刪除元素 | name: key名 values: 值,可為多個 | redis.srem("tags", "Book") | 從key為tags的set中刪除Book | 1,即刪除的數據個數 |
spop(name) | 隨機返回并刪除key為name的set中一個元素 | name: key名 | redis.spop("tags") | 從key為tags的set中隨機刪除并返回該元素 | b"Tea" |
smove(src, dst, value) | 從src對應的set中移除元素并添加到dst對應的set中 | src: 源set dst: 目標set value: 元素值 | redis.smove("tags", "tags2", "Coffee") | 從key為tags的set中刪除元素Coffee并添加到key為tags2的set | True |
scard(name) | 返回key為name的set的元素個數 | name: key名 | redis.scard("tags") | 獲取key為tags的set中元素個數 | 3 |
sismember(name, value) | 測試member是否是key為name的set的元素 | name:key值 | redis.sismember("tags", "Book") | 判斷Book是否為key為tags的set元素 | True |
sinter(keys, *args) | 返回所有給定key的set的交集 | keys: key列表 | redis.sinter(["tags", "tags2"]) | 返回key為tags的set和key為tags2的set的交集 | {b"Coffee"} |
sinterstore(dest, keys, *args) | 求交集并將交集保存到dest的集合 | dest:結果集合 keys:key列表 | redis.sinterstore("inttag", ["tags", "tags2"]) | 求key為tags的set和key為tags2的set的交集并保存為inttag | 1 |
sunion(keys, *args) | 返回所有給定key的set的并集 | keys: key列表 | redis.sunion(["tags", "tags2"]) | 返回key為tags的set和key為tags2的set的并集 | {b"Coffee", b"Book", b"Pen"} |
sunionstore(dest, keys, *args) | 求并集并將并集保存到dest的集合 | dest:結果集合 keys:key列表 | redis.sunionstore("inttag", ["tags", "tags2"]) | 求key為tags的set和key為tags2的set的并集并保存為inttag | 3 |
sdiff(keys, *args) | 返回所有給定key的set的差集 | keys: key列表 | redis.sdiff(["tags", "tags2"]) | 返回key為tags的set和key為tags2的set的差集 | {b"Book", b"Pen"} |
sdiffstore(dest, keys, *args) | 求差集并將差集保存到dest的集合 | dest:結果集合 keys:key列表 | redis.sdiffstore("inttag", ["tags", "tags2"]) | 求key為tags的set和key為tags2的set的差集并保存為inttag | 3 |
smembers(name) | 返回key為name的set的所有元素 | name: key名 | redis.smembers("tags") | 返回key為tags的set的所有元素 | {b"Pen", b"Book", b"Coffee"} |
srandmember(name) | 隨機返回key為name的set的一個元素,但不刪除元素 | name: key值 | redis.srandmember("tags") | 隨機返回key為tags的set的一個元素 |
Sorted Set,即有序集合,它相比集合多了一個分數字段,利用它我們可以對集合中的數據進行排序,其用法總結如下:
方法 | 作用 | 參數說明 | 示例 | 示例說明 | 示例結果 |
---|---|---|---|---|---|
zadd(name, args, *kwargs) | 向key為name的zset中添加元素member,score用于排序。如果該元素存在,則更新其順序 | name: key名 args: 可變參數 | redis.zadd("grade", 100, "Bob", 98, "Mike") | 向key為grade的zset中添加Bob,score為100,添加Mike,score為98 | 2,即添加的元素個數 |
zrem(name, *values) | 刪除key為name的zset中的元素 | name: key名 values: 元素 | redis.zrem("grade", "Mike") | 從key為grade的zset中刪除Mike | 1,即刪除的元素個數 |
zincrby(name, value, amount=1) | 如果在key為name的zset中已經存在元素value,則該元素的score增加amount,否則向該集合中添加該元素,其score的值為amount | name: key名 value: 元素 amount: 增長的score值 | redis.zincrby("grade", "Bob", -2) | key為grade的zset中Bob的score減2 | 98.0,即修改后的值 |
zrank(name, value) | 返回key為name的zset中元素的排名(按score從小到大排序)即下標 | name: key名 value: 元素值 | redis.zrank("grade", "Amy") | 得到key為grade的zset中Amy的排名 | 1 |
zrevrank(name, value) | 返回key為name的zset中元素的倒數排名(按score從大到小排序)即下標 | name: key名 value: 元素值 | redis.zrevrank("grade", "Amy") | 得到key為grade的zset中Amy的倒數排名 | 2 |
zrevrange(name, start, end, withscores=False) | 返回key為name的zset(按score從大到小排序)中的index從start到end的所有元素 | name: key值 start: 開始索引 end: 結束索引 withscores: 是否帶score | redis.zrevrange("grade", 0, 3) | 返回key為grade的zset前四名元素 | [b"Bob", b"Mike", b"Amy", b"James"] |
zrangebyscore(name, min, max, start=None, num=None, withscores=False) | 返回key為name的zset中score在給定區間的元素 | name:key名 min: 最低score max:最高score start: 起始索引 num: 個數 withscores: 是否帶score | redis.zrangebyscore("grade", 80, 95) | 返回key為grade的zset中score在80和95之間的元素 | [b"Amy", b"James"] |
zcount(name, min, max) | 返回key為name的zset中score在給定區間的數量 | name:key名 min: 最低score max: 最高score | redis.zcount("grade", 80, 95) | 返回key為grade的zset中score在80到95的元素個數 | 2 |
zcard(name) | 返回key為name的zset的元素個數 | name: key名 | redis.zcard("grade") | 獲取key為grade的zset中元素個數 | 3 |
zremrangebyrank(name, min, max) | 刪除key為name的zset中排名在給定區間的元素 | name:key名 min: 最低位次 max: 最高位次 | redis.zremrangebyrank("grade", 0, 0) | 刪除key為grade的zset中排名第一的元素 | 1,即刪除的元素個數 |
zremrangebyscore(name, min, max) | 刪除key為name的zset中score在給定區間的元素 | name:key名 min: 最低score max:最高score | redis.zremrangebyscore("grade", 80, 90) | 刪除score在80到90之間的元素 | 1,即刪除的元素個數 |
Hash,即哈希。Redis 還提供了哈希表的數據結構,我們可以用name指定一個哈希表的名稱,然后表內存儲了各個鍵值對,用法總結如下:
方法 | 作用 | 參數說明 | 示例 | 示例說明 | 示例結果 |
---|---|---|---|---|---|
hset(name, key, value) | 向key為name的hash中添加映射 | name: key名 key: 映射鍵名 value: 映射鍵值 | hset("price", "cake", 5) | 向key為price的hash中添加映射關系,cake的值為5 | 1,即添加的映射個數 |
hsetnx(name, key, value) | 向key為name的hash中添加映射,如果映射鍵名不存在 | name: key名 key: 映射鍵名 value: 映射鍵值 | hsetnx("price", "book", 6) | 向key為price的hash中添加映射關系,book的值為6 | 1,即添加的映射個數 |
hget(name, key) | 返回key為name的hash中field對應的value | name: key名 key: 映射鍵名 | redis.hget("price", "cake") | 獲取key為price的hash中鍵名為cake的value | 5 |
hmget(name, keys, *args) | 返回key為name的hash中各個鍵對應的value | name: key名 keys: 映射鍵名列表 | redis.hmget("price", ["apple", "orange"]) | 獲取key為price的hash中apple和orange的值 | [b"3", b"7"] |
hmset(name, mapping) | 向key為name的hash中批量添加映射 | name: key名 mapping: 映射字典 | redis.hmset("price", {"banana": 2, "pear": 6}) | 向key為price的hash中批量添加映射 | True |
hincrby(name, key, amount=1) | 將key為name的hash中映射的value增加amount | name: key名 key: 映射鍵名 amount: 增長量 | redis.hincrby("price", "apple", 3) | key為price的hash中apple的值增加3 | 6,修改后的值 |
hexists(name, key) | key為namehash中是否存在鍵名為key的映射 | name: key名 key: 映射鍵名 | redis.hexists("price", "banana") | key為price的hash中banana的值是否存在 | True |
hdel(name, *keys) | key為namehash中刪除鍵名為key的映射 | name: key名 key: 映射鍵名 | redis.hdel("price", "banana") | 從key為price的hash中刪除鍵名為banana的映射 | True |
hlen(name) | 從key為name的hash中獲取映射個數 | name: key名 | redis.hlen("price") | 從key為price的hash中獲取映射個數 | 6 |
hkeys(name) | 從key為name的hash中獲取所有映射鍵名 | name: key名 | redis.hkeys("price") | 從key為price的hash中獲取所有映射鍵名 | [b"cake", b"book", b"banana", b"pear"] |
hvals(name) | 從key為name的hash中獲取所有映射鍵值 | name: key名 | redis.hvals("price") | 從key為price的hash中獲取所有映射鍵值 | [b"5", b"6", b"2", b"6"] |
hgetall(name) | 從key為name的hash中獲取所有映射鍵值對 | name: key名 | redis.hgetall("price") | 從key為price的hash中獲取所有映射鍵值對 | {b"cake": b"5", b"book": b"6", b"orange": b"7", b"pear": b"6"} |
RedisDump 提供了強大的 Redis 數據的導入和導出功能,本節我們來看下它的具體用法。
首先確保已經安裝好了 RedisDump。
RedisDump 提供兩個可執行命令,redis-dump 用于導出數據,redis-load 用于導入數據。
redis-dump我們可以首先輸入如下命令查看所有可選項:
redis-dump -h
運行結果如下:
Usage: redis-dump [global options] COMMAND [command options] -u, --uri=S Redis URI (e.g. redis://hostname[:port]) -d, --database=S Redis database (e.g. -d 15) -s, --sleep=S Sleep for S seconds after dumping (for debugging) -c, --count=S Chunk size (default: 10000) -f, --filter=S Filter selected keys (passed directly to redis" KEYS command) -O, --without_optimizations Disable run time optimizations -V, --version Display version -D, --debug --nosafe
可以看到其參數,-u 代表 Redis 連接字符串,-d 代表數據庫代號,默認全部,-s 代表導出之后的休眠時間,-c 代表分塊大小,默認是 10000,-f 代表導出時的過濾器,-O 代表禁用運行時優化,-V 顯示版本,-D 開啟調試。
我們拿本地的 Redis 做測試,運行在 6379 端口上,密碼為 foobared,導出命令如下:
redis-dump -u :foobared@localhost:6379
如果沒有密碼的話可以不加密碼前綴,命令如下:
redis-dump -u localhost:6379
運行之后可以將本地 0-15號 數據庫的所有數據輸出出來,例如:
{"db":0,"key":"name","ttl":-1,"type":"string","value":"James","size":5} {"db":0,"key":"name2","ttl":-1,"type":"string","value":"Durant","size":6} {"db":0,"key":"name3","ttl":-1,"type":"string","value":"Durant","size":6} {"db":0,"key":"name4","ttl":-1,"type":"string","value":"HelloWorld","size":10} {"db":0,"key":"name5","ttl":-1,"type":"string","value":"James","size":5} {"db":0,"key":"name6","ttl":-1,"type":"string","value":"James","size":5} {"db":0,"key":"age","ttl":-1,"type":"string","value":"1","size":1} {"db":0,"key":"age2","ttl":-1,"type":"string","value":"-5","size":2}
每條數據都包含五個字段,db 即數據庫代號,key 即鍵名,ttl 即該鍵值對的有效時間,type 即鍵值類型,size 即占用空間。
如果想要將其輸出為 Json 行文件,可以使用如下命令:
redis-dump -u :foobared@localhost:6379 > ./redis_data.jl
這樣我們就可以成功將 Redis 的所有數據庫的所有數據導出成 Json 行文件了。
另外我們可以使用 -d 參數指定某個數據庫的導出,例如只導出 1 號數據庫的內容:
redis-dump -u :foobared@localhost:6379 -d 1 > ./redis.data.jl
如果只想導出特定的內容,如想導出 adsl 開頭的數據,可以加入 -f 參數用來過濾,命令如下:
redis-dump -u :foobared@localhost:6379 -f adsl:* > ./redis.data.jl
其中 -f 的參數即 Redis 的 keys 命令的參數,可以寫一些過濾規則。
redis-load我們同樣可以首先輸入如下命令查看所有可選項:
redis-load -h
運行結果如下:
redis-load --help Try: redis-load [global options] COMMAND [command options] -u, --uri=S Redis URI (e.g. redis://hostname[:port]) -d, --database=S Redis database (e.g. -d 15) -s, --sleep=S Sleep for S seconds after dumping (for debugging) -n, --no_check_utf8 -V, --version Display version -D, --debug --nosafe
可以看到其參數,-u 代表 Redis 連接字符串,-d 代表數據庫代號,默認全部,-s 代表導出之后的休眠時間,-n 代表不檢測 UTF-8 編碼,-V 顯示版本,-D 開啟調試。
我們可以將 Json 行文件導入到 Redis 數據庫中:
< redis_data.json redis-load -u :foobared@localhost:6379
這樣就可以成功將 Json 行文件導入到數據庫中了。
另外如下命令同樣可以達到同樣的效果:
cat redis_data.json | redis-load -u :foobared@localhost:6379
以上便是 RedisDump 的使用概述,使用它我們可以高效便捷地實現 Redis 數據庫的導入導出。
11. 結語本節我們了解了 RedisPy 對 Redis 數據庫的一些基本操作,另外還了解了 RedisDump 對數據導入導出做了演示,由于其便捷和高效性,在后文我們會利用 Redis 實現很多架構,如維護代理池、Cookies 池、ADSL 撥號代理池、ScrapyRedis 分布式架構等,所以 Redis 的操作需要好好掌握。
上一篇文章:Python3網絡爬蟲實戰---33、數據存儲:非關系型數據庫存儲:MongoDB
下一篇文章:Python3網絡爬蟲實戰---35、 Ajax數據爬取
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/44077.html
摘要:列存儲數據庫,代表有等。運行結果返回結果是字典形式,即代表執行成功,代表影響的數據條數。上一篇文章網絡爬蟲實戰數據存儲關系型數據庫存儲下一篇文章網絡爬蟲實戰數據存儲非關系型數據庫存儲 上一篇文章:Python3網絡爬蟲實戰---32、數據存儲:關系型數據庫存儲:MySQL下一篇文章:Python3網絡爬蟲實戰---34、數據存儲:非關系型數據庫存儲:Redis NoSQL,全稱 No...
摘要:的安裝是一個輕量級的關系型數據庫,以表的形式來存儲數據,本節我們來了解下它的安裝方式。相關鏈接官方網站下載地址中文教程下的安裝推薦使用安裝,執行命令即可。上一篇文章網絡爬蟲實戰解析庫的安裝下一篇文章網絡爬蟲實戰存儲庫的安裝 上一篇文章:Python3網絡爬蟲實戰---3、解析庫的安裝:LXML、BeautifulSoup、PyQuery、Tesserocr下一篇文章:Python3網絡...
摘要:所以說,我們所看到的微博頁面的真實數據并不是最原始的頁面返回的,而是后來執行后再次向后臺發送了請求,拿到數據后再進一步渲染出來的。結果提取仍然是拿微博為例,我們接下來用來模擬這些請求,把馬云發過的微博爬取下來。 上一篇文章:Python3網絡爬蟲實戰---34、數據存儲:非關系型數據庫存儲:Redis下一篇文章:Python3網絡爬蟲實戰---36、分析Ajax爬取今日頭條街拍美圖 ...
摘要:相關鏈接官方文檔安裝推薦使用安裝,命令如下運行完畢之后即可完成的安裝。上一篇文章網絡爬蟲實戰數據庫的安裝下一篇文章網絡爬蟲實戰庫的安裝 上一篇文章:Python3網絡爬蟲實戰---4、數據庫的安裝:MySQL、MongoDB、Redis下一篇文章:Python3網絡爬蟲實戰---6、Web庫的安裝:Flask、Tornado 在前面一節我們介紹了幾個數據庫的安裝方式,但這僅僅是用來存...
摘要:在本書中用到的一些服務程序主要有。本節來分別介紹它們的安裝方法。的安裝是一個輕量級的服務程序,簡單易用靈活,在本書中我們主要用它來做一些服務,本節我們來了解下它的安裝方式。相關鏈接官方文檔安裝執行完畢之后即可完成安裝。 上一篇文章:Python3網絡爬蟲實戰---5、存儲庫的安裝:PyMySQL、PyMongo、RedisPy、RedisDump下一篇文章:Python3網絡爬蟲實戰-...
閱讀 727·2023-04-25 20:32
閱讀 2287·2021-11-24 10:27
閱讀 4532·2021-09-29 09:47
閱讀 2251·2021-09-28 09:36
閱讀 3648·2021-09-22 15:27
閱讀 2768·2019-08-30 15:54
閱讀 380·2019-08-30 11:06
閱讀 1278·2019-08-30 10:58