zoukankan      html  css  js  c++  java
  • 数据类型--集合

    数据类型的种类

    常用的:
    1、数字
    2、字符串
    3、列表
    4、元祖
    5、集合

    不常用的:
    队列
    有序字典
    默认字典

    集合的特点

    1、无序
    2、去重(重要)
    3、可嵌套
    4、关系测试(重要)

    创建集合

    (一)、回顾:创建列表的2中方法:
    
    1、li = []  #直接创建
    2、list() #可以将其他数据类型转换成列表(相当于在内存有创建一个)
    
    注意:
         它会自动去执行list里面的构造方法__init__。
         list __init__,内部执行for循环(11,22,33,44)转换成[11,22,33,44]
         在定义  li=[]的时候,会内部调用list()这种方式。

    一、创建集合的注意事项:

    1、无序,不重复的序列

    1 set = {11,22,11,22}
    2 print(set)
    3 
    4 输出结果:
    5 {11, 22}

    2、用“{}”来代替,里面每个元素就是一个值,跟字典的区别就是无需key:values。
    3、set的功能: set()  == list() 
    4、将列表转换成集合的方法:

    1 li = [11,22,11,22]
    2 s1 = set(li)
    3 print(s1,type(s1))
    4 
    5 显示结果:
    6 {11, 22} <class 'set'>

    二、创建集合的三种方式:

    1、普通创建方法:

    1 1、se = {11,22} 
    2 例如:se = {"123","456"}

    2、创建空集合:

    1 s2 = set()             
    2 这个是通过__init__进行转换的

    3、转其他数据类型换成集合

    1 s3 = set([11,22,33,4])

    操作集合

    一、添元素:

    1 创建空集合:
    2 s = set()
    3 s.add(123)
    4 s.add(123)
    5 s.add(123)
    6 print(s)
    7 
    8 显示结果:
    9 {123}


    注意:上面示例添加了3次123,但是只能显示一个,因为set集合有去重功能。
    扩展:爬虫访问过的url放到一个set()中,可以通过去重功能,过滤掉访问过的url。

    二、清空set里的所有内容:

    1 s.clear()
    2 print(s)
    3 
    4 显示结果:
    5 set()

     

    三、A中存在B中不存在的

    注意:

    A是指谁调用的表(s1的位置),
    B就是被调用的表(s2的位置);
     1 #s1中存在s2中不存在的:
     2 s1 = {11,22,33}
     3 s2 = {22,33,44}
     4 s3 = s1.difference(s2)
     5 print(s3)
     6 
     7 
     8 #s2中存在s1中不存在的
     9 s3 = s2.difference(s1)
    10 print(s3)
    11 
    12 显示结果:
    13 {11}
    14 {44}

    四、取出A中存在,B中不存在的,然后将结果替换掉A中的元素:

    1 s1.difference_update(s2)
    2 print("s1:",s1)
    3 
    4 显示结果:
    5 s1: {11}

    注意:如果后续的代码不需要s1里面的元素时,可以使用带有Update方法来替换掉

    五、对称差距
    把A中存在的B中不存在的取出,
    在把B中存在的A中不存在的取出;

     1 s1 = {11,22,33}
     2 s2 = {22,33,44}
     3 
     4 s3 = s1.symmetric_difference(s2)
     5 print(s3)
     6 print(s1)
     7 print(s2)
     8 
     9 显示结果:
    10 {11, 44}
    11 {33, 11, 22}
    12 {33, 44, 22}

    六、对称差距更新s1

    取出A中存在B中不存在的元素,
    取出B中存在A中不存在的元素,
    将结果更新到A中

    1 s1.symmetric_difference_update(s2)
    2 print("更新s1",s1)
    3 
    4 显示结果:
    5 更新s1 {11, 44}

    注意:如果后续的代码不需要s1里面的元素时,可以使用带有Update方法来替换掉

    七、移除元素:

    #移除指定元素,不存在不报错:(以后推荐使用这个避免bug)
    s1 = {11,22,33}
    s1.discard(1111)
    print("移除1111,数据不存在,不会报错:",s1)
    
    
    #移除指定元素,如果不存在就直接报错。
    s1 = {11,22,33}
    s1.remove(22)
    print("移除指定元素,有就不报错:",s1)
    
    # s1.remove(111)
    # print("移除指定元素,没有就报错:",s1)
    
    #移除某个元素,并获取移除元素的值。(随机移除,不需要加参数,因为集合是无序的)
    s1 = {11,22,33,44}
    ret = s1.pop() #不用加参数
    print("集合无序,随机移除,返回移除的数据",s1)
    print("显示pop移除的元素:",ret)
    
    
    显示结果:
    移除1111,数据不存在,不会报错: {33, 11, 22}
    移除指定元素,有就不报错: {33, 11}
    集合无序,随机移除,返回移除的数据 {11, 44, 22}
    显示pop移除的元素: 33

    注意:使用pop的场景:以后再学到队列的时候会使用到,一般情况下移除一个元素,然后把移除的这个元素赋值到一个变量,然后在其他引用。

    八、取出A和B之间的交集:

    1 s1 = {11,22,33}
    2 s2 = {22,33,44}
    3 s3 = s1.intersection(s2)
    4 print("取出s1和s2的交集:",s3)
    5 
    6 
    7 显示结果:
    8 取出s1和s2的交集: {33, 22}

    九、取出A和B之间的交集,并更新到A里:

    1 s1 = {11,22,33}
    2 s2 = {22,33,44}
    3 
    4 s1.intersection_update(s2)
    5 print("取出A和B之间的交集,并更新到A里:",s1)
    6 
    7 输出结果:
    8 取出A和B之间的交集,并更新到A里: {33, 22}

    十、判断是否为包含于被包含的关系:

     1 s1 = {11,22,33}
     2 s2 = {22,33}
     3 s3 = s1.issuperset(s2)
     4 print("s1是s2的父序列:",s3)
     5 
     6 s3 = s2.issubset(s1)
     7 print("s2是s1的子序列:",s3)
     8 
     9 
    10 输出结果:
    11 s1是s2的父序列: True
    12 s2是s1的子序列: True

    十一、取出A和B的并集:

    1 s1 = {11,22,33}
    2 s2 = {22,33,44}
    3 s3 = s1.union(s2)
    4 print("显示A和B的并集:",s3)
    5 
    6 显示结果:
    7 显示A和B的并集: {33, 22, 11, 44}

    十二、批量添加,批量更新(对可循环和可迭代的对象有效)

     1 #批量添加,批量更新(对可循环和可迭代的对象有效)
     2 s1 = {11,22,33}
     3 s1.add(44)
     4 s1.add(55)
     5 s1.add(66)
     6 print("往s1里添加记录",s1)
     7 
     8 #eg:列表
     9 li = [11,22,3,11,2]
    10 s1.update(li)
    11 print("将li列表中的元素加入到s1里:",s1)
    12 
    13 #eg:元祖
    14 tuples = (66,77,8,10,2)
    15 s1.update(tuples)
    16 print("将元祖加入到s1里:",s1)
    17 
    18 #eg:字符串
    19 st = "abiao"
    20 s1.update(st)
    21 print("将字符串加入到s1里:",s1)
    22 
    23 
    24 显示结果:
    25 往s1里添加记录 {33, 66, 11, 44, 22, 55}
    26 将li列表中的元素加入到s1里: {33, 66, 3, 2, 11, 44, 22, 55}
    27 将元祖加入到s1里: {33, 66, 3, 2, 8, 10, 11, 44, 77, 22, 55}
    28 将字符串加入到s1里: {33, 66, 3, 2, 'o', 8, 'i', 10, 11, 44, 77, 'a', 'b', 22, 55}

    集合的源代码:

      1 class set(object):
      2     """
      3     set() -> new empty set object
      4     set(iterable) -> new set object
      5      
      6     Build an unordered collection of unique elements.
      7     """
      8     def add(self, *args, **kwargs): # real signature unknown
      9         """
     10         Add an element to a set,添加元素
     11          
     12         This has no effect if the element is already present.
     13         """
     14         pass
     15  
     16     def clear(self, *args, **kwargs): # real signature unknown
     17         """ Remove all elements from this set. 清除内容"""
     18         pass
     19  
     20     def copy(self, *args, **kwargs): # real signature unknown
     21         """ Return a shallow copy of a set. 浅拷贝  """
     22         pass
     23  
     24     def difference(self, *args, **kwargs): # real signature unknown
     25         """
     26         Return the difference of two or more sets as a new set. A中存在,B中不存在
     27          
     28         (i.e. all elements that are in this set but not the others.)
     29         """
     30         pass
     31  
     32     def difference_update(self, *args, **kwargs): # real signature unknown
     33         """ Remove all elements of another set from this set.  从当前集合中删除和B中相同的元素"""
     34         pass
     35  
     36     def discard(self, *args, **kwargs): # real signature unknown
     37         """
     38         Remove an element from a set if it is a member.
     39          
     40         If the element is not a member, do nothing. 移除指定元素,不存在不保错
     41         """
     42         pass
     43  
     44     def intersection(self, *args, **kwargs): # real signature unknown
     45         """
     46         Return the intersection of two sets as a new set. 交集
     47          
     48         (i.e. all elements that are in both sets.)
     49         """
     50         pass
     51  
     52     def intersection_update(self, *args, **kwargs): # real signature unknown
     53         """ Update a set with the intersection of itself and another.  取交集并更更新到A中 """
     54         pass
     55  
     56     def isdisjoint(self, *args, **kwargs): # real signature unknown
     57         """ Return True if two sets have a null intersection.  如果没有交集,返回True,否则返回False"""
     58         pass
     59  
     60     def issubset(self, *args, **kwargs): # real signature unknown
     61         """ Report whether another set contains this set.  是否是子序列"""
     62         pass
     63  
     64     def issuperset(self, *args, **kwargs): # real signature unknown
     65         """ Report whether this set contains another set. 是否是父序列"""
     66         pass
     67  
     68     def pop(self, *args, **kwargs): # real signature unknown
     69         """
     70         Remove and return an arbitrary set element.
     71         Raises KeyError if the set is empty. 移除元素
     72         """
     73         pass
     74  
     75     def remove(self, *args, **kwargs): # real signature unknown
     76         """
     77         Remove an element from a set; it must be a member.
     78          
     79         If the element is not a member, raise a KeyError. 移除指定元素,不存在保错
     80         """
     81         pass
     82  
     83     def symmetric_difference(self, *args, **kwargs): # real signature unknown
     84         """
     85         Return the symmetric difference of two sets as a new set.  对称差集
     86          
     87         (i.e. all elements that are in exactly one of the sets.)
     88         """
     89         pass
     90  
     91     def symmetric_difference_update(self, *args, **kwargs): # real signature unknown
     92         """ Update a set with the symmetric difference of itself and another. 对称差集,并更新到a中 """
     93         pass
     94  
     95     def union(self, *args, **kwargs): # real signature unknown
     96         """
     97         Return the union of sets as a new set.  并集
     98          
     99         (i.e. all elements that are in either set.)
    100         """
    101         pass
    102  
    103     def update(self, *args, **kwargs): # real signature unknown
    104         """ Update a set with the union of itself and others. 更新 """
    105         pass
    View Code
  • 相关阅读:
    [python]如何理解uiautomator里面的 instance 及使用场景
    [python]如何理解uiautomator里面的 right,left,up,down 及使用场景
    [python] try......except.....finally
    [python]python官方原版编码规范路径
    [python]pip 版本9.0.1升级到10.0.1故障解决办法
    [python]如何理解uiautomator里面的 child, child_by_text, sibling,及使用场景
    [python]关于在python中模块导入问题追加总结
    [Eclipse]如何往eclipse中导入单个python文件,其它类型代码文件也可以参照该方法
    [Eclipse]在重命令文件名时,提示编码格式有问题导致修改失败,需要设置如下几个默认编码为UTF-8
    [MySQL]在安装windows版MySQL时遇到过如下问题Error Nr.1045和Error.Nr.2003,相应解决办法如下
  • 原文地址:https://www.cnblogs.com/abobo/p/8035235.html
Copyright ? 2011-2022 开发猿


http://www.vxiaotou.com