Jiahong 的个人博客

凡事预则立,不预则废


  • Home

  • Tags

  • Archives

  • Navigation

  • Search

数据结构——堆排序

本文介绍堆排序的思想和代码

  • 参考链接:堆排序【超详细+代码】

相关基本概念

  • 完全二叉树 :除最后一层外,每层节点都填满;最后一层节点从左到右排列
    • 完全二叉树的核心性质 :任意节点索引为 i 的子节点为:
      • 左子节点索引 2*i+1
      • 右子节点索引 2*i+2
  • 大顶堆(最大堆) :每个父节点的值 ≥ 其子节点的值(堆排序常用)
    • 注:小顶堆则与大顶堆相反,父节点的值小于其他子节点
  • 堆排序是一种基于完全二叉树结构(堆)的高效排序算法
    • 时间复杂度稳定为 \(O(n \log n)\),且是原地排序(空间复杂度 \(O(1)\))

基本思想

  • 堆排序实现步骤:
    • 第一步:初始化生成最大堆(heapify)
      • 功能:将无序数组转化为大顶堆(根节点是整个数组的最大值)
      • 做法:从倒数第一个非叶节点开始,按照下虑操作找到该节点在最大堆中的位置,逐步遍历每一个非叶结点执行上述操作,生成最大堆
    • 第二步:交换最大值到末尾
      • 功能:将堆顶的最大值放到数组末尾(确定一个元素的最终位置)
      • 做法:交换根节点与最后一个元素的值,树节点减少1(刚才根节点是当前树的最大值,更换以后就是有序的元素了,不再参与最大堆调整)
    • 第三步:重新生成最大堆(调整根节点)
      • 功能:对剩余未排序的元素重新调整为大顶堆
      • 做法:调整新换上来的根节点(下虑操作),找到其应该在的地方,重新生成最大堆
    • 循环执行:循环 第二步 和 第三步,直到最大堆只剩下一个元素

总结

  1. 堆排序的核心是构建大顶堆 + 逐步提取堆顶最大值,利用堆的特性实现高效排序
  2. 堆化(heapify)是关键操作,作用是修复不符合大顶堆规则的子树,时间复杂度为 $O(\log n)$
  3. 堆排序的优势是时间复杂度稳定(不受数据分布影响),缺点是不稳定(相同值的元素可能改变相对位置)

堆排序关键子步骤:堆化(Heapify)

  • 堆化是堆排序的核心操作,作用是修复不符合大顶堆规则的子树
    • 输入:数组、堆的大小、需要调整的父节点索引 i
    • 逻辑:
      • 1)先假设当前父节点 i 是最大值节点
      • 2)核心 :找到 i 的左子节点(索引 2*i+1)和右子节点(索引 2*i+2)
      • 3)比较父节点与左右子节点,找到最大值的索引 largest
      • 4)如果 largest != i(父节点不是最大值),交换两者的值,使得父节点变成最大值;然后并递归调整被交换的子节点(因为交换后子树可能不符合堆规则)

堆排序 Python 代码实现(带详细注释)

  • 代码实现:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    def heap_sort(arr):
    """
    堆排序(升序)实现
    :param arr: 待排序的数组(列表)
    """
    n = len(arr)

    # 第一步:构建大顶堆(从最后一个非叶子节点开始向前遍历)
    # 最后一个非叶子节点的索引:n//2 - 1(完全二叉树特性)
    for i in range(n // 2 - 1, -1, -1):
    heapify(arr, n, i)

    # 第二步:逐个取出堆顶元素(最大值),放到数组末尾
    for i in range(n - 1, 0, -1):
    # 交换堆顶(arr[0])和当前未排序部分的末尾(arr[i])
    arr[0], arr[i] = arr[i], arr[0]
    # 对剩余未排序的元素(0到i-1)重新堆化(堆大小变为i)
    heapify(arr, i, 0)

    def heapify(arr, heap_size, parent_idx):
    """
    堆化函数:调整以 parent_idx 为根的子树为大顶堆
    :param arr: 待调整的数组
    :param heap_size: 当前堆的有效大小(未排序部分的长度)
    :param parent_idx: 需要调整的父节点索引
    """
    largest = parent_idx # 初始化最大值为父节点
    left_child = 2 * parent_idx + 1 # 左子节点索引
    right_child = 2 * parent_idx + 2 # 右子节点索引

    # 1. 比较父节点与左子节点,更新最大值索引
    if left_child < heap_size and arr[left_child] > arr[largest]:
    largest = left_child

    # 2. 比较当前最大值与右子节点,更新最大值索引
    if right_child < heap_size and arr[right_child] > arr[largest]:
    largest = right_child

    # 3. 如果最大值不是父节点,交换并递归调整子树
    if largest != parent_idx:
    arr[parent_idx], arr[largest] = arr[largest], arr[parent_idx]
    # 递归调整被交换的子节点(因为交换后子树可能不符合堆规则)
    heapify(arr, heap_size, largest) # largest 是刚换下来的父节点,此时作为父节点继续判断是否满足最大堆

    # 测试示例
    if __name__ == "__main__":
    # 待排序数组
    test_arr = [12, 11, 13, 5, 6, 7]
    print("排序前数组:", test_arr)

    heap_sort(test_arr)

    print("排序后数组:", test_arr)
  • 代码中关键逻辑解释:

    • 1)构建大顶堆 :
      • 从最后一个非叶子节点(n//2 -1)开始向前遍历,因为叶子节点本身就是堆(单个节点满足堆的性质),无需调整
      • 每个节点通过 heapify 函数调整为大顶堆,最终整个数组变成大顶堆(根节点是最大值)
    • 2)交换堆顶与末尾元素 :
      • 堆顶(arr[0])是当前未排序部分的最大值,交换到数组末尾后,该元素的位置就固定了
      • 每次交换后,堆的有效大小减 1(因为末尾元素已排序),重新对剩余元素堆化
    • 3)堆化函数的递归调整 :
      • 交换父节点和子节点后,子节点所在的子树可能不再是大顶堆,因此需要递归调整该子树

附录:数据流中的中位数实现

  • 题目实现
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    # -*- coding:utf-8 -*-
    class Solution:
    def __init__(self):
    self.left_max = []
    self.right_min = []

    def Insert(self, num):
    # write code here
    if not self.left_max or num < self.left_max[0]:
    self.left_max.append(num)
    Solution.heapify_up_max(self.left_max, len(self.left_max)-1)
    if len(self.left_max) > len(self.right_min) + 1:
    mid = Solution.pop_max(self.left_max)
    self.right_min.append(mid)
    Solution.heapify_up_min(self.right_min, len(self.right_min)-1)
    else:
    self.right_min.append(num)
    Solution.heapify_up_min(self.right_min, len(self.right_min)-1)
    if len(self.right_min) > len(self.left_max)+1:
    mid = Solution.pop_min(self.right_min)
    self.left_max.append(mid)
    Solution.heapify_up_max(self.left_max, len(self.left_max)-1)
    pass

    def GetMedian(self):
    # write code here
    if len(self.right_min) > len(self.left_max):
    return self.right_min[0]
    elif len(self.right_min) < len(self.left_max):
    return self.left_max[0]
    else:
    return (self.right_min[0] + self.left_max[0])/2
    pass

    @staticmethod
    def heapify_up_max(a, i):
    curr = i
    while (curr-1)//2 >= 0:
    if a[curr] > a[(curr-1)//2]:
    a[(curr-1)//2], a[curr] = a[curr], a[(curr-1)//2]
    else:
    break
    curr = (curr-1)//2

    @staticmethod
    def heapify_up_min(a, i):
    curr = i
    while (curr-1)//2 >= 0:
    if a[curr] < a[(curr-1)//2]:
    a[(curr-1)//2], a[curr] = a[curr], a[(curr-1)//2]
    else:
    break
    curr = (curr-1)//2

    @staticmethod
    def heapify_down_max(a, i):
    maxi = i
    if i*2+1 < len(a) and a[i*2+1] > a[maxi]:
    maxi = i*2+1
    if i*2+2 < len(a) and a[i*2+2] > a[maxi]:
    maxi = i*2+2
    if maxi != i:
    a[maxi], a[i] = a[i], a[maxi]
    Solution.heapify_down_max(a, maxi)

    @staticmethod
    def heapify_down_min(a, i):
    mini = i
    if i*2+1 < len(a) and a[i*2+1] < a[mini]:
    mini = i*2+1
    if i*2+2 < len(a) and a[i*2+2] < a[mini]:
    mini = i*2+2
    if mini != i:
    a[mini], a[i] = a[i], a[mini]
    Solution.heapify_down_min(a, mini)

    @staticmethod
    def pop_min(a):
    result = a[0]
    a[0] = a.pop()
    Solution.heapify_down_min(a, 0)
    return result

    @staticmethod
    def pop_max(a):
    result = a[0]
    a[0] = a.pop()
    Solution.heapify_down_max(a, 0)
    return result

机器码——源码-补码-反码

参考博客:https://www.cnblogs.com/zhangziqiu/archive/2011/03/30/ComputerCode.html


基础

机器数

  • 一个数在计算机中的二进制表示形式, 叫做这个数的机器数。机器数是带符号的,在计算机用一个数的最高位存放符号, 正数为0, 负数为1.
    • 比如,十进制中的数 +3 ,计算机字长为8位,转换成二进制就是00000011。如果是 -3 ,就是 10000011
  • 那么,这里的 00000011 和 10000011 就是机器数

真值

  • 因为第一位是符号位,所以机器数的形式值就不等于真正的数
  • 例如上面的有符号数 10000011,其最高位1代表负,其真正数值是 -3 而不是形式值131(10000011转换成十进制等于131)
  • 所以,为区别起见,将带符号位的机器数对应的真正数值称为机器数的真值
    • 例:0000 0001的真值 = +000 0001 = +1,1000 0001的真值 = –000 0001 = –1

原码, 反码, 补码

  • 计算机要使用一定的编码方式进行存储. 原码, 反码, 补码是机器存储一个具体数字的编码方式.

原码

  • 原码就是符号位加上真值的绝对值, 即用第一位表示符号, 其余位表示值. 比如如果是8位二进制:

    [+1]原 = 0000 0001
    [-1]原 = 1000 0001

  • 第一位是符号位. 因为第一位是符号位, 所以8位二进制数的取值范围就是:

    [1111 1111 , 0111 1111]
    [-127 , 127]

  • 原码是人脑最容易理解和计算的表示方式

反码

  • 反码的表示方法是:
    • 正数的反码是其本身
    • 负数的反码是在其原码的基础上, 符号位不变,其余各个位取反.

      [+1] = [00000001]原 = [00000001]反
      [-1] = [10000001]原 = [11111110]反

  • 可见如果一个反码表示的是负数, 人脑无法直观的看出来它的数值. 通常要将其转换成原码再计算.

补码

  • 补码的表示方法是:
    • 正数的补码就是其本身
    • 负数的补码是在其原码的基础上, 符号位不变, 其余各位取反, 最后+1. (即在反码的基础上+1)

      [+1] = [00000001]原 = [00000001]反 = [00000001]补
      [-1] = [10000001]原 = [11111110]反 = [11111111]补

  • 对于负数, 补码表示方式也是人脑无法直观看出其数值的. 通常也需要转换成原码在计算其数值.

Python中特殊加法运算负数非负的问题

原始题目

  • 剑指 Offer:不用加减乘除对两个整数做加法
    1
    2
    3
    4
    5
    6
    def Add(num1, num2):
    mask = 0xFFFFFFFF
    max_value = 0x7FFFFFFF
    while num2:
    num1, num2 = (num1^num2)&mask, (num1&num2)<<1
    return num1 if num1 <= max_value else ~(num1^mask)
~(num1^mask)的理解
  • 此处实际上是假设num1是一个32位的整型数(在C++和Java中的定义为int,也就是默认32位整型数),Python中由于无法定义整型位数,也就无法识别正常的负数
    • num1为0x8FFFFFFF在C++和Java中为32位整型数时,实际上是个负数
    • Python无法识别到这个负数,因为Python的数值存储长度很长,强制转换也不行
    • 如果我们可以将num1的后32位不变,前面的所有位置取反(由0变成1) ,那么就可以得到Python中的负数值
    • 此时如果先用num1^mask即可得到一个后面32位取反,前面其他位置全部保留正常(实际上都还是0)
      • 原因是mask后32位是1,所以num1每一位为0时异或结果为1,为1时异或结果为0,整体上就等价于对后32位取反
    • 在后面的位置取反后再对所有位置全部取反,那么就可以实现对num1的后32位不变,前面所有位置取反的操作得到Python中的负数的补码

通用——日常杂记

本文记录一些日常通用的笔记,定期整理入其他的路径下


日常笔记

  • Linux 中,realpath 命令可显示文件绝对路径
  • jsonl 文件中每一行是一个 json 字符串
  • Linux 中,汇总显示当前文件夹下占用大小:du -bsh
    • -s 参数表示总结性展示一个数字即可
  • Python 中,函数内部若不使用 return 而是 ...,则表示返回 None
  • Python 中,x = a or b 等价于 x = a if a else b

U盘——做系统盘后恢复空间

U盘做系统盘后空间会减少,本文给出恢复U盘空间的方法
U盘做系统时会自动隐藏部分空间,用于放置启动文件,这些被隐藏的空间用普通的格式化方法无法恢复


Windows

  • 第一步:清除 U 盘: cmd 输入diskpart

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    # show all disks
    list disk
    # select target disk(our usb flash disk)
    select disk=n
    # show all disks again
    # make sure we have chosen the right disk
    # there will be a star in choosed disk
    list disk
    # clean the disk
    clean
  • 第二步:用任意方式格式化 U 盘

系统安装——Win10-U盘启动盘制作

由于 Windows10 过大,install.win 文件超过 4GB,常规的 U 盘启动盘制作都是面向 FAT 分区方式的,该方式无法存储超过 4GB 的文件,本文给出一种解决方案


Windows10 U 盘启动盘制作方法:

  • 打开 UltraISO 制作镜像
    • 注意不勾选 create boot partition 选项,否则 U 盘中会隐藏分区,看不到文件
  • 使用 convert H:/fs:ntfs(H 为 U 盘盘符,ntfs 可支持 4GB 以上的文件)
  • 解压 ISO 文件并替换 U 盘中的 ./sources/install.win 文件(因为该文件大于 4GB,FAT 分区格式无法写入)

Numpy——reshape函数


维度确定

规则为从前到后,参数由外到内,由行到列

  • values.reshape(2,3) 表示二行三列(2,3)
  • values.reshape(4,2,3) 表示四个(2,3),四个两行三列
  • values.reshape(5,4,2,3) 表示五个(4,2,3)

reshape本质理解

实际上numpy多维数组变化维度时,内存数据没有变化,只是有一个shape参数指明维度即可

  • 每次变化维度的过程可以理解为先将维度还原到(参考:维度确定)一维数组,然后再转化成制定的目标维度
  • 返回的是新对象,但是新老对象数据共享,只有shape等内部属性不一样,所以reshape操作不浪费内存,也不耗费时间,但是需要注意数据共享可能造成的误操作
    • 测试说明: 使用DataFrame.values.reshape()生成的新对象内存数据不共享

特殊参数 “-1“

用于智能补齐某一维度,只能有一个参数为-1

  • 除了-1参数外,其余的部分一定要能够被整除
  • -1本身占用一个维度
  • 假设一维数组维度为12
    • (-1, 2) <==> (6, 2) <==> (6, -1)
    • (-1) <==> (12)

Numpy——transpose函数

用于矩阵维度的转换


transpose函数的使用

  • 用法说明

    1
    nums.transpose(dims)
    • nums为np.ndarray类型的对象
    • dims为表示维度排列的tuple
      • 对于二维矩阵,只有0, 1两个维度,所以只能是(0,1), (1,0)
      • 三维矩阵,有0,1,2三个维度,所以可以是是(0,1,2)的所有全排列,共6个

简单易懂的解释

  • 只改变维度, 每一维度对应的数据不会变, 比如图片的shape为: (28, 28, 3),那么无论怎么变化维度, 变换后的数据中维度大小为3的那个维度都是表示通道, (28,28)总是表示图片的每个通道的数据
  • 原始numpy.ndarray,shape为(2,3,4)
    • .transpose((0,1,2)): shape为(2,3,4), 不变
    • .transpose((1,0,2)): shape为(3,2,4)
    • .transpose((2,1,0)): shape为(4,3,2)
  • 测试代码
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    import numpy as np

    origin = np.random.random_integers(1, 100, (2,3,4))
    print("-"*20 + "origin")
    print(origin)
    print("-"*20 + "(0,1,2)")
    print(origin.transpose((0,1,2)))
    print("-"*20 + "(1,0,2)")
    print(origin.transpose((1,0,2)))
    print("-"*20 + "(2,1,0)")
    print(origin.transpose((2,1,0)))

    # Output:
    --------------------origin
    [[[50 36 80 53]
    [45 45 94 91]
    [49 29 69 53]]

    [[85 83 61 18]
    [16 89 80 60]
    [99 13 36 40]]]
    --------------------(0,1,2)
    [[[50 36 80 53]
    [45 45 94 91]
    [49 29 69 53]]

    [[85 83 61 18]
    [16 89 80 60]
    [99 13 36 40]]]
    --------------------(1,0,2)
    [[[50 36 80 53]
    [85 83 61 18]]

    [[45 45 94 91]
    [16 89 80 60]]

    [[49 29 69 53]
    [99 13 36 40]]]
    --------------------(2,1,0)
    [[[50 85]
    [45 16]
    [49 99]]

    [[36 83]
    [45 89]
    [29 13]]

    [[80 61]
    [94 80]
    [69 36]]

    [[53 18]
    [91 60]
    [53 40]]]

与reshape的区别

reshape的用法:
1
nums.reshape(shape)
* `nums`为`np.ndarray`类型的对象
* `shape`为表示维度排列的`tuple`
    * `shape`必须与原始`nums.shape`兼容,即每个`shape`元素相乘的结果相等
  • 从numpy中矩阵的存储开始讲起,numpy存储数据是C++的方式存储为一行的,然后分为不同shape以不同方式进行索引
  • reshape相当于是把原始数据先还原成一行(实际上没操作),然后再转变成指定shape的数据,本质上数据存储没变化,只是shape变了,以后索引方式也就变了
区别
  • reshape修改的只是shape,每个维度的意义变了
  • transpose修改的只是维度,同时shape跟着变化而已,每个维度的顺序变了,但是意义不会变

Sklearn——CountVectorizer使用介绍


导入

1
from sklearn.feature_extraction.text import CountVectorizer

使用示例

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
# 新建一个CountVectorizer对象,以下简称CV对象
vectoerizer = CountVectorizer(min_df=min_df, max_df=max_df, stop_words=stop_words, token_pattern=r"(?u)\b[\w-][\w-]+\b")

# 使用文本集合(一个文本的列表)训练当前CountVectorizer对象
# texts = ["this is a text", "this is another text"]
vectoerizer.fit(texts)

# 训练后可以读取当前CV对象信息
bag_of_words = vectoerizer.get_feature_names()

# 使用CV对象生成任意文本集合的信息,返回对象是文档到字典的数组统计(统计单词数量)
# 这里的texts不必要是之前使用过的,可以是新的文本集合,但是词典已经确定,不能再拓展了,不存在字典中的词直接忽略
X = vectoerizer.transform(texts)

# 使用X对象,toarray()将返回 term/token counts 矩阵,可直接用于TfidfTransformer等对象的训练
X.toarray()

重要参数说明

  • min_df: 用于排除出现次数太少的terms

    • min_df = 0.01 意味着将忽略出现在少于%1的文档中的词
    • min_df = 5 意味着将忽略只出现在5篇以下文档中的词,不包括5篇
  • max_df:

    • max_df = 0.50 意味着将忽略出现在多于%50的文档中的词
    • max_df = 25 意味着将忽略出现在25篇以上文档中的词,不包括25篇

Python——抽象类和继承与Java的不同点

Python也开始支持抽象类和多态了,但是Python的继承与Java有很多不同的地方


Python只有私有属性

(双下划线__属性)和公有属性(默认属性),没有protected属性

  • 解决方案是Python提出命名时单下划线的属性为protected属性
    • 但是这只是一种口头约定,Python解释器并不做强制处理
  • 模块中的函数如果是单下划线开头的,那么该函数属于当前模块保护的
    • 此时某些IDE,比如Idea能够给出提示,但是用户仍可访问
    • 编程时建议将模块中不被调用的文件定义为_开头的,这样可以提示自己和别人当前函数不会在模块外被调用

Python类属性定义

属性定义在__init__函数中才能在对象中通过__dict__属性读取到


Python支持虚拟继承

可以欺骗编译器,不用真正实现虚拟基类的所有接口


都是强类型语言

这是他们的相同点,但我觉得写在这里是必要的


方法类型不同

  • Java中有一般方法(实例方法),静态方法(static类名和对象均可直接调用)两种
    • Java中这两种方法也都可以被继承和隐藏 ,而不能被重写(隐藏的意思时换成对应的父类指针还能访问到父类的静态属性和方法)
  • Python中有一般方法(实例方法),静态方法(@staticmethod类名和对象均可直接调用)和类方法@classmethod
    • 对@staticmethod方法的理解是,该方法与类密切相关,但是不需要访问这个类
    • Python的@staticmethod和@classmethod方法调用方式一样,唯一的区别在于@classmethod方法第一个参数必须是当前类(一般命名为cls)
    • Python中的这三种方法都可以被继承和重写

函数定义

  • 三种函数, 普通函数(实例函数), 类函数(classmethod), 静态函数(staticmethod)

普通函数

  • 无需任何装饰器
  • 无论如何定义,函数的第一个参数都会被当成实例对象本身(一般用self)

类函数

  • 装饰器 @classmethod
  • 无论如何定义,函数的第一个参数都会被当成实例对象本身(一般用cls)

静态函数

  • 装饰器 @staticmethod
  • 所有参数都是函数所有,不被占用

Python——Python中-m参数的使用


整体说明

  • 在 Python 中,-m 参数是一个非常有用的工具,它允许你将模块作为脚本运行,并且可以处理复杂的包结构。无论是运行标准库模块、自定义模块,还是与包结合使用,-m 参数都能简化操作。它的基本语法如下:

    1
    python -m module_name
  • 其中,module_name 是你要运行的模块名(不包含 .py 后缀)。Python 会在 sys.path 中查找该模块,并执行它


运行标准库模块

  • -m 参数常用于运行 Python 标准库中的模块。例如:

    1
    python -m http.server
  • 这会启动一个简单的 HTTP 服务器,默认监听在 8000 端口。http.server 是 Python 标准库中的一个模块,-m 参数让 Python 将其作为脚本运行


运行自定义模块

  • 你也可以使用 -m 参数运行自定义模块。假设你有一个项目结构如下:

    1
    2
    3
    4
    my_project/
    my_module/
    __init__.py
    main.py
  • 你可以在 my_project 目录下运行以下命令:

    1
    python -m my_module.main

这会执行 my_module/main.py 文件中的代码


运行包中的模块

  • 如果模块位于包中,-m 参数会自动处理包的导入路径。例如:

    1
    python -m package.subpackage.module
  • 这会执行 package/subpackage/module.py 文件中的代码


与 __main__.py 结合使用

  • 如果你有一个包,并且希望在运行包时执行特定的代码,可以在包目录下创建一个 __main__.py 文件。例如:

    1
    2
    3
    4
    my_package/
    __init__.py
    __main__.py
    other_module.py
  • 在 __main__.py 中编写你想要执行的代码,然后运行:

    1
    python -m my_package
    • Python
  • 这会执行 my_package/__main__.py 文件中的代码


与 python -c 结合使用

  • -m 参数也可以与 -c 参数结合使用,直接在命令行中运行模块。例如:

    1
    python -c "import os; print(os.getcwd())" -m http.server
    • 注:python -c "print('hello')"常常用来执行一个Python命令且不需要创建文件
1…464748…64
Joe Zhou

Joe Zhou

Stay Hungry. Stay Foolish.

631 posts
53 tags
GitHub E-Mail
© 2026 Joe Zhou
Powered by Hexo
|
Theme — NexT.Gemini v5.1.4