温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

python数据结构之列表、字典、元组、集合

发布时间:2020-07-07 22:19:54 来源:网络 阅读:1056 作者:cxf210210 栏目:编程语言

列表

列表在python里是有序集合对象类型。
列表里的对象可以是任何对象:数字,字符串,列表或者字典,元组。与字符串不同,列表是可变对象,支持原处修改的操作
python的列表是:

  • 任意对象的有序集合
  • 通过偏移读取
  • 可变长度、异构以及任意嵌套
  • 属于可变序列的分组
  • 对象引用数组
列表的操作

列表的操作和字符串大部分都相同:
合并/重复:

  • list1+list2:结果是两个列表按顺序结合
  • list*3:结果是列表list重复三次
  • for i in list1: print(i):按顺序打印列表里的内容
  • 3 in list:判断列表里有没有一个对象是对象3
  • list1.index(1):查找列表里第一个为1的对象的位置
  • list1.count(1):查找列表里对象为1的个数
  • list1[x:y]:取第x到y的对象,重新建立一个列表
  • len(list1):list1里的对象个数
基本列表操作

创建一个列表:

>>> list=[]
>>> list=[1,2,'3',[]]
>>> list
[1, 2, '3', []]

列表取值:

>>> list[1]
2
>>> list[0:3]
[1, 2, '3']

重复列表内容:

>>> list*3
[1, 2, '3', [], 1, 2, '3', [], 1, 2, '3', []]

使用in方法来判断对象是否在列表中:

>>> 3 in list
False
>>> [] in list
True

循环打印:

>>> for i in list:
...     print (i,end=' ')
...
1 2 3 [] 

迭代方式创建列表:

>>> list=[i*4 for i in 'ASDF' ]
>>> list
['AAAA', 'SSSS', 'DDDD', 'FFFF']

矩阵:

list=[ [1,2,3,],[4,5,6],[7,8,9] ]
>>> list
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
>>> list[0][1]
2
>>> list[1][2]
6

列表原处修改:

>>> food=['spam','eggs','milk']
>>> food[1]
'eggs'
>>> food[1]='Eggs'
>>> food[:]
['spam', 'Eggs', 'milk']
列表的方法
  • 列表的添加:
>>>food.append('cake')  
>>> food
['spam', 'Eggs', 'milk', 'cake']
  • 列表的排序:
>>> food.sort()    
>>> food
['Eggs', 'cake', 'milk', 'spam']
  • 合并列表:
    >>> list1=[1,2,3]
    >>> list2=[4,5,6]
    >>> list1.extend(list2)
    >>> list1
    [1, 2, 3, 4, 5, 6]
  • 列表的取值:
    >>> list1.pop()
    6
    >>> list1
    [1, 2, 3, 4, 5]
  • 列表倒序显示:
    >>> list1
    [1, 2, 3, 4, 5]
    >>> list1.reverse()
    >>> list1
    [5, 4, 3, 2, 1]
  • 列表的索引:
    >>> list=[1,2,3,4,5]
    >>> list.index(3)
    2
  • 列表的插入:
    >>> list.insert(2,10)
    >>> list
    [1, 2, 10, 3, 4, 5]
  • 删除列表的某一个对象:
    >>> list
    [1, 2, 10, 3, 4, 5]
    >>> del list[2]
    >>> list
    [1, 2, 3, 4, 5]
  • 列表的排序:
    列表的排序默认是先以字母大小写进行排序的,可以在列表中加一个选项key=lower.str使其都转换成小写,使用reverse=True进行倒序排列
>>> list=['abc','aDd','ace']
>>> sorted(list)
['aDd', 'abc', 'ace']
>>> list
['abc', 'aDd', 'ace']
>>> sorted(list,key=str.lower,reverse=True)
['aDd', 'ace', 'abc']
>>> sorted(list,key=str.lower)
['abc', 'ace', 'aDd']
>>>sorted([x.lower() for x in list])
['abc', 'ace', 'add']
>>> sorted([x.lower() for x in list],reverse=True)
['add', 'ace', 'abc']
列表的实际用法
  • 取值:
    >>> info=['myname',18,[1997,9,28]]
    >>> _name,_age,_birth=info
    >>> _name
    'myname'
    >>> _age
    18
    >>> _birth
    [1997, 9, 28]
    >>> _name,_age,(_birth_y,_birth_m,_birth_d)=info
    >>> _birth_y
    1997
    >>> _birth_m,_birth_d
    (9, 28)

    当取的值不固定的时候,可以用*代替:

    >>> a=['adc',122,2215,'asd@asd']
    >>> a_name,*a_phone,a_mail=a
    >>> a_name
    'adc'
    >>> a_phone
    [122, 2215]
  • 只保留列表里最后N个元素:
    使用deque函数可以设置列表中的元素个数,如果超过列表最大限制,那么会将列表里最左边的元素删掉,如果是在左边添加的,那么删除的是最右边的元素
    >>> from collections import deque
    >>> q=deque(maxlen=3)
    >>> q.append(1)
    >>> q.append(2)
    >>> q.append(3)
    >>> q
    deque([1, 2, 3], maxlen=3)
    >>> q.append(4)
    >>> q
    deque([2, 3, 4], maxlen=3) 
    >>> q.appendleft('5')
    >>> q
    deque(['5', 2, 3], maxlen=3)
  • 取出列表中的最大值和最小值:
    使用heapq模块的nlargest,nsmallest方法来取出列表中的几个最大值和最小值,当然也可以使用max和min函数来求最大和最小,使用sum函数来求列表数字的和
    >>> from heapq import nlargest,nsmallest
    >>> num=[1,4,6,7,8,8,34,64,23,7,45,34]
    >>> nlargest(3,num)
    [64, 45, 34]
    >>> nlargest(2,num)
    [64, 45]
    >>> nsmallest(2,num)
    [1, 4]
    >>> nsmallest(4,num)
    [1, 4, 6, 7]
    >>> num
    [1, 4, 6, 7, 8, 8, 34, 64, 23, 7, 45, 34]
    >>> max(num)
    64
    >>> min(num)
    1
    >>> sum(num)
    241
    >>> a_info=['wanger','wangerxiao',25,'computer']
    >>> _name=slice(0,2)
    >>> _age=slice(2,3)
    >>> _job=slice(3,4)
    >>> a_info[_name]
    ['wanger', 'wangerxiao']
    >>> a_info[_age]
    [25]
    >>> a_info[_job]
    ['computer']
  • 重复元素计算:
    这会用到collections模块的Counter方法
    >> a=[1,2,3,4,5,6,2,4,2,5,6]
    >>> from collections import Counter
    >>> count_word=Counter(a)
    >>> count_word
    Counter({2: 3, 4: 2, 5: 2, 6: 2, 1: 1, 3: 1})
    >>> count_word.most_common(3)
    [(2, 3), (4, 2), (5, 2)]
    >>> count_word.most_common(2)
    [(2, 3), (4, 2)]

    字典

    字典在python里是无序集合对象类型。
    字典的值都有独立的唯一的键,用相应的键来取值。
    python字典主要特性如下:

  • 通过键而不是偏移量来读取
  • 任意对象的无序组合
  • 可变长,异构,任意嵌套
  • 属于可映射类型
  • 对象引用表

字典用法注意事项:

  • 序列运算无效——串联,分片不能使用
  • 对新索引(键)赋值会添加项
  • 键不一定是字符串——只要是不可变的对象(列表字典除外)
字典的基本操作:
  • 字典的赋值:

    >>> dict={'a':97,'b':98}
    >>> len(dict)
    2
    >>> print("ascii code of 'a' is {},ascii code of 'b' is {}".format(dict['a'],dict['b']))
    ascii code of 'a' is 97,ascii code of 'b' is 98
  • 判断特定的键是否存在于字典里:

    >>> 'a' in dict
    True
    >>> 'b
    >>>> 'b' is in dict
    True
  • 原处修改:
    #更改特定键的值
    >>> food={'eggs':3,'ham':1,'spam':4}
    >>> food['ham']=2
    >>> food
    {'eggs': 3, 'ham': 2, 'spam': 4}
    #增加新的键和相应的值
    >>> food['branch']=['bacon','bake']
    >>> food
    {'eggs': 3, 'ham': 2, 'spam': 4, 'branch': ['bacon', 'bake']}
    #删除一个字典元素
    >>> del food['eggs']
    >>> food
    {'ham': 2, 'spam': 4, 'branch': ['bacon', 'bake']}
    #清空字典所有条目
    >>> dict.clear()
    #删除字典
    del dict
    字典的方法
  • 查找字典的键值是否存在,如果不存在可以设置返回的值

    >>> food.get('ham')
    2
    >>> dict.get('b')
    2
    >>> dict.get('0')
    >>> dict.get('0','none')
    'none'
  • 创建字典的方法:
    1.最原始的方法:

    dict={'name':'wanger','age':25}

    2.按键赋值方法:

    >>> dict={}
    >>> dict['name']='wanger'
    >>> dict['age']=25
  • 字典的比较:
    字典的比较会比较字典的键,而不是字典的值,可以使用zip方式将字典的值和键反过来,这样就会比较值了,可以使用sorted函数对字典进行排序

    >>> dict={'a':1,'b':2,'c':3,'d':4}
    >>> max(dict)
    'd'
    >>> min(dict)
    'a'
    >>> max(zip(dict.values(),dict.keys()))
    (4, 'd')
    >>> min(zip(dict.values(),dict.keys()))
    (1, 'a')
    >>> sorted(zip(dict.values(),dict.keys()))
    [(1, 'a'), (2, 'b'), (3, 'c'), (4, 'd')]
    >>> sorted(zip(dict.values(),dict.keys()),reverse=True)
    [(4, 'd'), (3, 'c'), (2, 'b'), (1, 'a')]
  • 字典列表的排序:
    可以使用sorted函数进行排序,使用key参数可以对排序的键进行定义,这里要用到operator模块的itemgetter函数
    >>> rows
    [{'fname': 'Brian', 'lname': 'Jones', 'uid': 1003},
    {'fname': 'David', 'lname': 'Beazley', 'uid': 1002}, 
    {'fname': 'John', 'lname': 'Clesse', 'uid': 1001},
    {'fname': 'Big', 'lname': 'Jones', 'uid': 1004}]
    >>> from operator import itemgetter
    >>> rows_fname=sorted(rows,key=itemgetter('fname'))
    >>> rows_fname
    [{'fname': 'Big', 'lname': 'Jones', 'uid': 1004},
    {'fname': 'Brian', 'lname':
    'Jones', 'uid': 1003}, 
    {'fname': 'David', 'lname': 'Beazley', 'uid': 1002}, 
    {'fname': 'John', 'lname': 'Clesse', 'uid': 1001}]
    >>> rows_uid=sorted(rows,key=itemgetter('uid'))
    >>> rows_uid
    [{'fname': 'John', 'lname': 'Clesse', 'uid': 1001}, 
    {'fname': 'David', 'lname': 'Beazley', 'uid': 1002}, 
    {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003},
    {'fname': 'Big', 'lname': 'Jones', 'uid': 1004}]

元组

元组简介

元组与列表非常类似,只是不能在原处更改,元祖在python里的特点:

  • 任意对象的有序组合
  • 通过偏移取数据
  • 属于不可变序列类型
  • 固定长度,异构,任意嵌套
  • 对象引用的数组
元组的创建

元祖创建在只有单个元素的时候,必须加逗号(,),元组里可以嵌套元组

>>> tuple=()
>>> tuple=(1,)
>>> type(tuple)
<class 'tuple'>
#这里加不加括号都一样
>>> tuple=(1,2,'3',(4,5))
>>> tuple
(1, 2, '3', (4, 5))
>>> tuple=1,2,'3',(4,5)
>>> tuple
(1, 2, '3', (4, 5))
将列表转换为元组
>>> list=[1,2,3,4]
>>> sd=tuple(list)
>>> sd
(1, 2, 3, 4)
元组的方法
  • 元组的排序:
    元组经过sorted排序后,会将其转换为列表

    >>> tuple=(1,5,3,6,4,2)
    >>> sorted(tuple)
    [1, 2, 3, 4, 5, 6]
  • 查找元组元素位置:
    >>> tuple
    (1, 5, 3, 6, 4, 2)
    >>> tuple.index(3)
    2
  • 计算元组元素数目:

    >>> tuple
    (1, 5, 3, 6, 4, 2)
    >>> tuple.count(3)
    1
  • 元组的切片:

    >>> tuple[0]
    1
    >>> tuple[2:]
    (3, 6, 4, 2)
    >>> tuple[2:3]
    (3,)
  • 列表和元组的操作类似,列表操作里只要不是在原处修改的,都可用于元组
    >>> (1,2)+(3,4)
    (1, 2, 3, 4)
    >>> (1,2)*4
    (1, 2, 1, 2, 1, 2, 1, 2)
    >>> len(tuple)
    6

    集合

    集合简介

    set是一个无序且不重复的元素集合
    集合对象十一组无序排列的可哈希的值,集合成员可以做字典中的键。set也支持用in 和not in操作符检查成员,由于集合本身是无序的,不可以为集合创建索引或执行切片操作,也没有键可用来获取集合中元素的值。

集合特点
  • 集合中的元素和字典中的键一样不重复
  • 集合中的元素为不可变对象
集合的创建
>>> s=set('a')
>>> a=set({'k1':1,'k2':2})
>>> b=(['y','e','d','o'])
>>> c={'a','b','c'}
>>> d={('a','b','c')}
集合基本操作
  • 集合的比较
    #比较a、b集合中a中存在,b中不存在的集合
    >>> a={11,22,33}
    >>> b={11,23,45}
    >>> a.difference(b)
    {33, 22}
    #找到a中存在,b中不存在的集合,并把a、b集合中都有的值覆盖掉
    >>> a={11,22,33}
    >>> print(a.difference_update(b))
    None
    >>> a
    {33, 22}
  • 集合的删除:

    >>> a={11,22,33}
    >>> a.discard(11)
    >>> a.discard(44)
    >>> a
    {33, 22}
    #移除不存在的元素会报错
    >>> a={11,22,33}
    >>> a.remove(11)
    >>> a.remove(44)
    Traceback (most recent call last):
    File "<stdin>", line 1, in <module>
    KeyError: 44
    >>> a
    {33, 22}
    #移除末尾的元素
    >>> a={11,22,33}
    >>> a.pop()
    33
    >>> a
    {11, 22}
  • 取交集:

    #取交集赋给新值
    >>> a={1,2,3,4}
    >>> b={6,5,4,3}
    >>> print (a.intersection(b))
    {3, 4}
    #取交集并把交集赋给a
    >>> print (a.intersection_update(b))
    None
    >>> a
    {3, 4}
  • 集合判断:
    >>> a={3,4}
    >>> b={6,5,4,3}
    #判断a是否与b没有交集,有交集False,无交集True
    >>> a.isdisjoint(b)
    False
    #判断a是否是b的子集
    >>> a.issubset(b)
    True
    #判断a是否是b的父集
    >>> a.issuperset(b)
    False
  • 集合合并:
    >>> a={1,2,3,4}
    >>> b={3, 4, 5, 6}
    #打印不同的元素
    >>> print (a.symmetric_difference(b))
    {1, 2, 5, 6}
    #打印不同的元素,并覆盖到集合a
    >>> print (a.symmetric_difference_update(b))
    None
    >>> a
    {1, 2, 5, 6}
  • 集合取并集:
    >>> a={1, 2, 5, 6}
    >>> b={3, 4, 5, 6}
    >>> print (a.union(b))
    {1, 2, 3, 4, 5, 6}
  • 集合的更新:

    >>> a={1, 2, 5, 6}
    >>> b={3, 4, 5, 6}
    #把a、b的值合并,并把值赋给集合a
    >>> a.update(b)
    >>> a
    {1, 2, 3, 4, 5, 6}
    #添加a集合的元素
    >>> a.update([7,8])
    >>> a
    {1, 2, 3, 4, 5, 6, 7, 8}
  • 集合的转换:
    将集合分别转换为列表、元组、字符串
    >>> a=set(range(5))
    }
    >>> li=list(a)
    >>> tu=tuple(a)
    >>> st=str(a)
    >>> print (li)
    [0, 1, 2, 3, 4]
    >>> print (tu)
    (0, 1, 2, 3, 4)
    >>> print (st)
    {0, 1, 2, 3, 4}

python文件

文件简介

文件对象在python里可以作为操作系统上的文件的链接
文件对象的使用方式与之前的字符串、列表等对象不同,它是对文件的输入、输出进行控制
在python里会用open函数来进行文件的控制

文件的访问

在python里使用open函数可以访问文件。
基本格式是:open(<file_address>[,access_mode])
这里的文件地址是文本形式,在Windows里由于文件地址是使用反斜杠(),所以,可以使用r来对反斜杠不进行转义。
例如:
open(r'C:\mydir\myfile')
访问模式里是参数,默认是r(读取)
在访问模式,每一种方法都有一种使用到b的方式,就是二进制模式。
文件的读写参数

操作说明符 解释
r 以只读方式打开文件,这是默认模式
rb 以二进制格式打开一个文件用于只读。这是默认模式
r+ 打开一个文件用于读写
rb+ 以二进制格式打开一个文件用于读写
w 打开一个文件只用于写入。文件存在则覆盖,不存在,则创建新文件
wb 以二进制格式打开一个文件只用于写入。文件存在则覆盖,不存在则创建
w+ 打开一个文件用于读写。如果文件已存在则将其覆盖,不存在则创建新文件。
wb+ 以二进制打开一个文件用于读写。如果该文件存在则覆盖,不存在则创建
a 打开一个文件用于追加,如果文件内容存在,则将新内容追加到文件末尾,不存在则创建新文件写入
ab 以二进制格式打开一个文件用于写入
a+ 打开一个文件用于读写,如果该文件存在,则会将新的内容追加到文件末尾,如果文件不存在,则创建新文件用于读写。
ab+ 以二进制格式打开一个文件用于追加,文件存在将追加,不存在则创建新文件用于读写
文件的使用
  • 迭代器是最好的读行工具,比如使用for循环
  • 内容是字符串,不是对象,文件读取完之后,内容是以字符串的形式读取的。
  • close是通常选项,当你使用完文件后,使用close方法来关闭文件关联
  • 文件是缓冲而且是可查找的,flush或close()方法可以直接存储缓存里的内容,seek方法可以转到指定位置,当我们使用文件的时候,跟其他对象一样,用一个变量来引用

例子

>>> file1=open(r'D:\ruanjian\1.txt','w')
>>> file1.write('hello,world')
11
>>> file1.close()
>>> file1=open(r'D:\ruanjian\1.txt')
>>> file1.read()
'hello,world'
#tell用于获取文件指针位置,文件读取之后,文件指针在最后面
>>> file1.tell()
11
>>> file1.close()
>>>> file1=open(r'D:\ruanjian\1.txt')
>>> file1.seek(6)
6
>>> file1.read(5)
'world'
文件的读取

当我们要读取前五个字符的时候可以这样:

>>> file1=open(r'D:\ruanjian\1.txt')
>>> file1.read(5)
'hello'
>>> file1.tell()
5

当我们要按行读取的时候,可以使用readline和readlines方法

>>> file1=open(r'D:\ruanjian\1.txt')
>>> file1.readline()
'hello,world\n'
>>> file1.readline()
'wanger\n'
>>> file1.readline()
'asdfgghh'
>>> file1.readline()
''
>>> file1=open(r'D:\ruanjian\1.txt')
>>> file1.readlines()
['hello,world\n', 'wanger\n', 'asdfgghh']
文件的写入

当我们需要写入到一个文件的时候,会使用w模式。当相应的文件存在时,会覆盖原先的文件然后写入,当相应的文件不存在时会创建新文件。

  • 基本写入

    >>> file=open(r'D:\ruanjian\1.txt','w')
    >>> file.write('hello,world')
    11
    >>> file.write('|wanger')
    7
    >>> file.flush()
    >>> file.close()
    >>> file=open(r'D:\ruanjian\1.txt')
    >>> file.read()
    'hello,world|wanger'

    在这里flush()方法是把缓存里的内容写入硬盘中。当运行close()方法的时候,也会进行同样操作。

  • 按列表写入:
    writelines是把列表里的元素一个一个输入进去。当然,元素里的字符串最后没有换行,最终结果也不是换行的。

    >>> list=['hello,world!\n','wanger\n','asdfgh\n']
    >>> file=open(r'D:\ruanjian\1.txt','w')
    >>> file.writelines(list)
    >>> file.close()
    >>> file=open(r'D:\ruanjian\1.txt')
    >>> file.read()
    'hello,world!\nwanger\nasdfgh\n'
  • 在特定位置写入
    当我们输入错误的时候,可以把指针挪到最前面,然后继续输入。seek可以有两个传递变量,只有一个变量或者第一个变量为0时,就是更改当前的指针,第二个变量为1的时候,会返回当前指针位置,这个与tell方法同样,最后,第一个变量为0,第二个变量为2的时候会把指针放到最后

    >>> file=open(r'D:\ruanjian\1.txt','w')
    >>> file.write('heelo')
    5
    >>> file.seek(0)
    0
    >>> file.write('hello')
    5
    >>> file=open(r'D:\ruanjian\1.txt')
    >>> file.read()
    'hello'
  • 在最后写入
    之前看到的w模式,当文件是已有文件,就会删除里面的所有内容后再写入的。当我们需要在最后添加,而不是删除原有内容时,可以使用a模式。

    >>> file=open(r'D:\ruanjian\1.txt')
    >>> file.read()
    'hello'
    >>> file.close()
    >>> file=open(r'D:\ruanjian\1.txt','a')
    >>> file.write('my name is wanger')
    17
    >>> file=open(r'D:\ruanjian\1.txt')
    >>> file.read()
    'hellomy name is wanger'

    在模式里,我们会看到r+,w+,a+三种模式都有读写的方法。
    r+模式,只能打开已有文件,打开时保留原有文件,对文件可读,可写,也可更改原有内容。打开是指针在文件最前面。
    w+模式,打开时没有相应的文件,会创建;有相应的文件会覆盖原有的内容
    a+模式,可以打开原有文件,也可创建新的文件,打开时指针为文件的最后位置。指针可以放到任何位置来读内容,但写入时,指针默认会移动到最后,然后写入。

模式 打开已有文件 打开新的文件 打开时指针位置 写入时指针位置
r+ 保留内容 发生错误 文件开头 当前位置
w+ 删除内容 创建文件 文件开头 当前位置
a+ 保留内容 创建文件 文件尾端 文件尾端
文件的访问
  • 二进制模式
    在这个模式中,在python2.x中不会有什么特别,因为在2.x里存储方式就是二进制方式,但在python3.x里是Unicode方式。
    >>> cha='啊'
    >>> cha_b=cha.encode()
    >>> file=open(r'D:\ruanjian\1.txt','w')
    >>> file.write(cha)
    1
    >>> file.write(cha_b)
    Traceback (most recent call last):
    File "<stdin>", line 1, in <module>
    TypeError: write() argument must be str, not bytes
    >>> file.close()
    >>> file=open(r'D:\ruanjian\1.txt')
    >>> file.read()
    '啊'
    >>> file=open(r'D:\ruanjian\1.txt','wb')
    >>> file.write(cha)
    Traceback (most recent call last):
    File "<stdin>", line 1, in <module>
    TypeError: a bytes-like object is required, not 'str'
    >>> file.write(cha_b)
    3
    >>> file.close()
    >>> file=open(r'D:\ruanjian\1.txt','rb')
    >>> file.read()
    b'\xe5\x95\x8a'
文件与其他类型
  • 原生对象的存取
    存储一些对象的时候,比如说列表,字典等;python都需要把这些对象转换成字符串后存储:
    >>> file=open(r'D:\ruanjian\1.txt','w')
    >>> file.write({'a':97})
    Traceback (most recent call last):
    File "<stdin>", line 1, in <module>
    TypeError: write() argument must be str, not dict
    >>> file.write(str({'a':97}))
    9
    >>> file.write(str([1,2]))
    6
    >>> file.close()
    >>> file=open(r'D:\ruanjian\1.txt')
    >>> file.read()
    "{'a': 97}[1, 2]"

如果要将存储的字符串转换回原来的数据类型,可以用pickle模块:

>>> file=open(r'D:\ruanjian\1.txt','wb')
>>> a={'a':97}
>>> pickle.dump(a,file)
>>> file.close()
>>> file=open(r'D:\ruanjian\1.txt','rb')
>>> a_=pickle.load(file)
>>> a_
{'a': 97}
打印输出至文件

需要把打印的内容直接输出到文件里的时候:

>>> with open (r'D:\ruanjian\1.txt','w') as f:
...     print ('hello,world!',file=f)
...
>>> with open (r'D:\ruanjian\1.txt') as f:
...     f.read()
...
'hello,world!\n'
判断文件是否存在,不存在时写入

因为w方式对已存在的文件会清楚后写入,但有的时候我们不想覆盖原有的文件,我们可以使用如下方式:

>>> if not os.path.exists(r'D:\ruanjian\1.txt'):
...     with open(r'D:\ruanjian\1.txt','wt') as f:
...             f.write('hello,world')
... else:
...     print ('file already exists')
...
file already exists

在python3.x中我们也可以使用这种方式来判断文件是否存在,存在的话会报错,不存在的话文件可以创建

>>> with open(r'D:ruanjian\2.txt','xt') as f:
...     f.write('hello\n')
...
6
>>> with open(r'D:ruanjian\2.txt','xt') as f:
...     f.write('hello\n')
...
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
FileExistsError: [Errno 17] File exists: 'D:ruanjian\\2.txt'
读写压缩文件

文件在存储时也可以压缩存储,需要用到gzip或者bz2模块,在这两个模块中,默认是二进制模式,因此需要使用wt,rt等,指定text模式。读的时候使用rt,和read()。
压缩级别可以用compresslevel来设置,也可以使用open里的encoding,errors,newline等。

>>> with gzip.open(r'D:\ruanjian\1.gz','wt') as f:
...     f.write('text')
...
4
>>> with gzip.open(r'D:\ruanjian\1.gz','rt') as f:
...     f.read()
...
'text'
>>> with bz2.open(r'D:\ruanjian\1.bz2','wt') as f:
...     f.write('hello,world')
...
11
>>> with bz2.open(r'D:\ruanjian\1.bz2','rt') as f:
...     f.read()
...
'hello,world'
获取文件夹中的文件列表

这要用到os模块里的方法,关于os模块可以查看公众号的历史消息,对os模块有详细的解释,这里只列出一些简单的方法:

>>> import os
>>> os.getcwd()
'/root/blog'
>>> os.listdir('.')
['_config.yml', 'node_modules', '.gitignore', 'source', 'db.json', 'themes', 'package.json', 'public', 'scaffolds', '.deploy_git']
#当需要判断是文件时
>>> files=[file for file in os.listdir('.') if os.path.isfile(os.path.join('.',file))]
>>> files
['_config.yml', '.gitignore', 'db.json', 'package.json']

欢迎各位关注我的微信公众号
python数据结构之列表、字典、元组、集合

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI