在python怎么实现一个自动化接口的文件分片上传功能

发布时间：2020-11-20 15:14:38 来源：亿速云阅读：290 作者：Leah 栏目：开发技术

在python怎么实现一个自动化接口的文件分片上传功能？相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。

背景和目的：

利用python request 编写脚本测试公司系统的文件上传接口。前端读取文件的大小然后文件分片传给后端，后端将每一片数据重新组合成文件。大概的过程是：前端将整个文件的md5、size（大小）、name（文件名）、ext（文件后缀）、totalchunk（分片总数）与分片文件的md5、chunk（分片数据），chunkindex（当前分片文件的下标）等传给后台，后台取得这些数据后，通过chunkindex将每一片数据重组，重组完后，进行md5校验，判断文件上传是否成功。我只需要去调用后台的接口，然后判断文件是否上传成功，并且上传没有错误，其他的文件校验就不用去深究。

开发前端使用的是vue，后台使用的是php，要利用python实现对这一接口的调用，那么就先要将前端数据给模拟出来，然后循环去调用接口，将文件分片上传，我的思路大概如下：

1.获取整个文件的大小、名字、后缀、分片总数，定义每片文件的大小：

def __init__(self,data):
    dat = json.loads(data)
    self.path = dat['path'] # 获取文件路径
    self.CHUNK_SIZE = 1024*1024*2 # 定义每片文件的大小
    self.size = os.path.getsize(dat['path']) # 获取文件的大小
    self.totalchunk = math.ceil(self.size / self.CHUNK_SIZE) # 获取文件的分片总数
    self.ext = os.path.basename(dat['path']).split('.').pop() # 获取文件的后缀
    self.name = os.path.basename(dat['path']) # 获取文件的名字

2.获取文件的md5，查看了开发那边的md5算法，利用python实现过程如下：

# 使用hashlib库的md5方法获取指定文件的md5
def getmd5(self,path):
m = hashlib.md5()
with open(path, 'rb') as f:
 for line in f:
    m.update(line)
    md5code = m.hexdigest()
    return md5code

 # 开发那边对md5的算法进行了优化，当文件的大小小于1M时，直接通过getmd5方法去获取文件的md5值;
 # 当文件大于1M时，通过截取整个文件中的某几个片段，然后拼接成一个文件，再去获取其md5值，最后删除这个文件
  def md5(self,path):
    if self.size < 1024 * 1024:
      return self.getmd5(path)
    f = open(path, 'rb')
    f.seek(0, 0)
    data = f.read(2012)
    f.seek(int(self.size / 2) - 1999, 0)
    data += f.read(1999)
    f.seek(-2010, 2)
    data += f.read(2010)
    f.close()
    path = 'D:/copy_' + str(os.path.basename(path))
    f = open(path, 'wb')
    f.write(data)
    f.close()
    val = self.getmd5(path)
    os.remove(path)
    return val

3.调用文件上传的接口

def uploading(self, chunkIndex):
    MD5 = self.md5(self.path) # 整个文件的md5
    start = (chunkIndex - 1) * self.CHUNK_SIZE # 截取文件的起始位置
    end = min(self.size, start + self.CHUNK_SIZE)# 截取文件的结束位置
    f = open(self.path, 'rb')
    f.seek(start)
    data = f.read(end) # 待分片上传的数据
    f.close()
    path2 = 'D:/copy_' + str(os.path.basename(self.path)) # 将该数据保存在本地
    f = open(path2, 'wb')
    f.write(data)
    f.close()
    chunk_md5 = self.md5(path2) # 读取分片上传数据的md5
    # 将所有的数据储存在files字典当中，利用requests的files传输数据
    # 使用requests files类型时，要像下面一样构建参数，不然会有错误
    files={
      'chunk':('blob',data,'application/octet-stream'),
      'name':(None,self.name),
      'ext':(None,self.ext),
      'index':(None,chunkIndex),
      'total': (None,self.totalchunk),
      'size': (None,self.size),
      'chunk_md5': (None,chunk_md5),
      'md5': (None,MD5),
    }
    # 使用requests发送接口请求
    res = self.request.send('post', 'https://10.104.17.222/bank/elements/uploading', verify=False, files=files)
    os.remove(path2) # 删除存在本地的分片文件
    return res.json()

4.循环调用文件上传的接口

chunkIndex = 1
 while chunkIndex <= totalchunk:
 res2 = upload.uploading(chunkIndex)
 chunkIndex += 1

5.从服务器上去读取通过接口上传的文件的md5值，判断是否正确

看完上述内容，你们掌握在python怎么实现一个自动化接口的文件分片上传功能的方法了吗？如果还想学到更多技能或想了解更多相关内容，欢迎关注亿速云行业资讯频道，感谢各位的阅读！

向AI问一下细节

在python怎么实现一个自动化接口的文件分片上传功能

猜你喜欢

最新资讯

相关推荐

相关标签