类型¶

常见场景类型速查：

场景	推荐类型	说明
条件判断	`bool`	可直接用于 `if`、`while` 等条件上下文
选项开关、位掩码	`flag` / `flagN`	语义上表示标志位，避免误用为普通整数
通用文本	`str` / `str8`	默认使用 `str`；需要明确 UTF-8 时使用 `str8`
C 互操作字符串	`cstr8` / `cstr16` / `cstr32`	以 `\0` 结尾，便于与 C 或系统 API 交互
原始二进制数据	`bytes`	不绑定文本编码，适合协议与文件字节流
数学整数运算	`iN` / `uN`	参与算术运算时优先使用整数类型
二进制位操作	`bitN`	只允许位运算，不允许算术运算
网络/文件固定端序字段	`iNle` / `iNbe` / `uNle` / `uNbe`	显式端序，避免跨平台歧义

基本类型¶

简写	全称	解释
	unit	空类型，不占空间；同时也是其值字面量
	bool	布尔值
	flag	标志位
	byte	字节
	char	Unicode 字符
	ascii	7 位 ASCII 字符，补齐到 8 位
	char8	8 位字符
	char16	16 位字符
	char32	32 位字符

unit 既是类型名，也是其唯一的值字面量；直接写 unit 即可表示该类型的唯一值，无需额外的字面量关键字。

bool 类型使用 true / false 字面量；flag 类型使用 on / off 字面量。两组字面量各自独立，不可混用，在类型检查阶段即报错。

标志位和布尔值的区别在于，布尔值可以用在条件判断中，而标志位只能和 on off 进行赋值和比较。

也就是说：

flag my_flag = on;

if (my_flag) { // 错误，不能将 flag 用在条件判断中
    ...
}

if (my_flag == on) { // 正确
    ...
}

这在配置场景下能有效避免误用标志位进行条件判断，提供更清晰的语义区分。

对于字符类型 char，它表示一个完整的 Unicode 字符，可以存储任何 Unicode 字符，在底层使用 UTF-32 编码存储。

对于 ascii，它表示一个 7 位 ASCII 字符，存储时会在最高位补一位到 8 位。

字符串类型¶

简写	全称	解释
str	string	任意编码字符串（但保证没有 `\0` 字符）
	str8	UTF-8 编码字符串
	str16	UTF-16 编码字符串
	str32	UTF-32 编码字符串
cstr	cstring	C 风格字符串（以 `\0` 结尾）
	cstr8	UTF-8 编码 C 风格字符串
	cstr16	UTF-16 编码 C 风格字符串
	cstr32	UTF-32 编码 C 风格字符串
	bytes	字节数组，不强制指定编码

str 是 Lumos 的默认字符串类型，它可以存储任意编码的字符串，但不允许包含空字符 (\0)。
str8 使用 UTF-8 编码，是一种变长编码，适合存储大部分文本数据，节省空间且兼容 ASCII。
str16 使用 UTF-16 编码，主要用于与 Windows API、Java 或 C# 等环境进行互操作。
str32 使用 UTF-32 编码，每个字符固定占用 4 字节。虽然内存占用较高，但它支持 $O(1)$ 时间复杂度的随机字符访问。
cstr 及其变体 (cstr8、cstr16、cstr32) 是以空字符 (\0) 结尾的字符串类型，主要用于与 C 语言及其库进行互操作。
bytes 类型本质上是逻辑不可变的字节数组，它不保证任何特定的编码。通常用于处理原始二进制数据或与旧系统交互。

所有的字符串类型在 Lumos 中默认都是逻辑不可变的。如果需要修改字符串，应当使用 StringBuilder 或转换为字符数组。

字符串字面量¶

val s1 = "Hello";       // 默认为 str
val s2 = u8"UTF-8";     // 显式指定为 str8
val s3 = u16"UTF-16";   // 显式指定为 str16
val s4 = u32"UTF-32";   // 显式指定为 str32
val s5 = b"Raw bytes";  // 显式指定为 bytes
val s6 = b16"UTF-16 bytes"; // bytes 类型的 UTF-16 编码字节串

更多信息见字符串字面量。

字符串与字符的关系¶

字符串可以被视为相应字符类型的集合：

str8 对应 char8 (UTF-8 code unit) 的序列。
str16 对应 char16 的序列。
str32 对应 char32 的序列。

注意：char 类型（Unicode 标量值）在迭代 str8 或 str16 时会进行解码。

二进制类型¶

bit 类型不允许算术运算，只允许位运算。
flag 用于表示标志位，其在 bit 类型的基础上禁用了移位运算。flag 类型支持位掩码（Bitmask）操作。

很多编程语言中使用 u32 u64 等类型来表示标志位，这样做是不合适的，因为这些类型允许算术运算和移位运算，而标志位不应该允许这些操作。

一般来说，标志位应当只允许按位与、或、异或、非等位运算。

简写	全称	解释
b8	bit8	8 位二进制数据
b16	bit16	16 位二进制数据
b32	bit32	32 位二进制数据
b64	bit64	64 位二进制数据
	flag8	8 位标志位
	flag16	16 位标志位
	flag32	32 位标志位
	flag64	64 位标志位
	byte	1 字节
	byte2	2 字节
	byte4	4 字节
	byte8	8 字节

一般我们提供 b1 到 b65536 和 flag1 到 flag65536 的二进制类型扩展。
一般同时提供 byte1 到 byte8192 的字节类型扩展。

从 bit 或 byte 类型转换到整数或浮点类型时，总是按照表示不变换算为对应字节数的整数或浮点数，反之亦然，也就是说我们可以通过 xxx as b32 as u32 简单的获取浮点数的二进制表示对应的整数值。

数字类型¶

整数使用 i 或 u 前缀表示有符号或无符号，浮点数使用 f 前缀表示浮点数。

Note

一般来说，看到 i u f 开头就表示它是用来做数学运算的类型。
我们将用作数学运算的类型和用作二进制数据存储的类型区分开来是为了避免混淆。

简写	全称	解释
i8	int8	8 位整数
i16	int16	16 位整数
i32	int32	32 位整数
i64	int64	64 位整数
u8	uint8	8 位无符号整数
u16	uint16	16 位无符号整数
u32	uint32	32 位无符号整数
u64	uint64	64 位无符号整数
f32	float32	32 位浮点数
f64	float64	64 位浮点数

此处以 64 位系统为例，在 32 位系统中 i64 f64 等类型应当是字长扩展类型

标识符保留策略：

int 定义编译期整数类型
uint 定义编译期无符号整数类型
float 定义编译期浮点类型
i[0-9]+ 有符号整数类型
u[0-9]+ 无符号整数类型
f[0-9]+ 浮点数类型

尝试使用上述保留标识符定义任何名称都会导致编译错误，当然使用字符串作为标识符来定义不在此限制内，因为这只会让导出名变成保留名字而已。

注意这些保留的标识符都是小写，如果你想定义的名称是大写开头的，可以放心使用这些名称。

整数类型¶

库依赖的承诺

鉴于第三方库很可能会依赖于默认的整数类型的补码表示，如果平台默认使用非补码表示的整数类型，可能会导致不可预期的行为，程序员需要自行承担风险。

浮点类型¶

浮点类型遵循 IEEE 754 及其扩展标准。

若平台不支持标准的 f32 与 f64 类型，则可以：

使用软件浮点实现（默认方案）
使用平台特定的浮点类型实现（需手动指定）

软件浮点实现

如果平台不支持硬件浮点运算，我们会使用软件浮点实现来提供浮点类型支持，这种情况下浮点类型的性能会大幅下降，建议尽量避免使用浮点类型，出于复杂性考虑，我们只会提供 f32 和 f64 两种浮点类型。

库依赖的承诺

鉴于第三方库很可能会依赖于浮点类型的 IEEE 754 表示，如果使用非标准表示的浮点类型，虽然不会像改变整数表示那样影响巨大，但也可能会导致不可预期的行为，程序员需要自行承担风险。

端序¶

默认采用平台定义的端序存储，如果需要指定小端或大端存储，请使用以下类型：

i16le i32le i64le 小端有符号整数
u16le u32le u64le 小端无符号整数
i16be i32be i64be 大端有符号整数
u16be u32be u64be 大端无符号整数
f32le f64le 小端浮点数
f32be f64be 大端浮点数

所有符合 2 的幂次方的字长扩展类型均支持小端和大端表示法，如 i128le u256be 等。

将一个指定端序的类型（如 u32le 或 u32be）赋值给原生端序类型（如 u32）时，如果端序不同，编译器会自动执行端序转换，反之亦然。

端序转换性能

端序转换会带来一定的性能开销，尤其是在大量数据处理时。
建议在性能敏感的场景下，尽量使用与平台端序一致的类型以减少转换开销。
如果源或目标是指定的端序类型，尽可能只在读取和写入时进行端序转换，而不是在每次操作时都进行转换。

u8/i8 类型的端序

由于 u8 和 i8 类型只有一个字节，因此它们没有端序的概念。
使用 u8le、u8be、i8le 或 i8be 类型是允许的，但它们与 u8 和 i8 类型完全相同，没有任何区别。

表示法¶

Lumos 支持为有符号整数指定不同的二进制表示法，默认使用平台定义的表示法，但也可以通过在类型名后添加表示法后缀来指定特定的表示法：

后缀	全称	解释
sm	Sign-Magnitude	原码表示
oc	One's Complement	反码表示
tc	Two's Complement	补码表示

示例：

i32tc 或 i32：32 位有符号整数，使用补码表示（默认）
i32sm：32 位有符号整数，使用原码表示
i32oc：32 位有符号整数，使用反码表示
i32smle：32 位原码有符号整数，小端存储
i32besmle 或 i32smbe：32 位原码有符号整数，大端存储

表示法与端序的组合：

表示法后缀和端序后缀可以组合使用。端序后缀可以跟在表示法后缀之后：

iNsm[le|be]：原码有符号整数，指定端序
iNoc[le|be]：反码有符号整数，指定端序
iN[le|be]：补码有符号整数（默认），指定端序

无符号整数

无符号整数（u 前缀类型）始终使用原码表示，不支持 sm、oc、tc 后缀。

数字字长扩展¶

一般来说我们提供 i2 到 i65536 和 u2 到 u65536 的整数类型扩展，但一般情况下应当少用这些扩展类型以保证性能。

一般来说 i128 u128 i256 u256 等符合 2 的幂次方的类型扩展会有更好的性能。

对于浮点类型扩展，我们在尽力而为的原则下提供。

浮点类型扩展

由于没有将浮点数扩展到任意位宽的标准，我们最多只能提供一些常见的浮点类型扩展。
我们只提供平台支持的浮点类型扩展，如 f16 f32 f64 f128 等。
我们不会考虑提供一些平台的私有浮点类型扩展，除非它们被广泛使用。
当然如果你的平台不支持任何扩展浮点类型，我们就不会提供任何扩展浮点类型。

编译期整数推导¶

我们提供 int 和 uint 两种编译期整数类型，对应于不限精度的有符号整数和无符号整数。

这些类型只能在编译期使用，不能作为变量的类型。

要不然是在编译期计算中计算出结果，要不然是可以找到一个确定的最小类型来存储该值。

推导的目标类型只会是 i32 u32 或以上的 2 的幂次方类型。

如果计算结果超过了 i64 的表示范围，编译器会自动推导到 i128 或更高类型。如果结果超过了编译器的原生上限，则会报错。

第三方编译器可以自定义此上限，但该上限不得小于 i128。

def fib(int n) -> int {
    if (n <= 1) {
        return n;
    }
    return fib(n - 1) + fib(n - 2);
}
val result = fib(10); // result 的类型为 i32

当然也可以显式转换为任何兼容的类型，但请注意编译期的有损转换会导致报错。
什么算有损转换
val a = 1.1 as i32;           // 错误，浮点数转换为整数会丢失小数部分
val b = (1.1).floor() as i32; // 正确，先取整再转换

Warning

请不要在编译期使用过多的不限精度类型，以免导致编译期间过长或内存占用过高。

编译期浮点推导¶

我们提供 float 编译期浮点类型，对应于不限精度的浮点数，实际在编译期中存储为有理数。

这个类型只能在编译期使用，不能作为变量的类型。

这个类型只能显式转换为具体的浮点类型。

def half() -> float {
    return 1 / 2;
}
val result_f32 = half() as f32; // 显式转换为 f32
val result_f64 = half() as f64; // 显式转换为 f64

当然也可以显式转换为任何兼容的类型，但请注意编译期的有损转换会导致报错。

Warning

请不要在编译期使用过多的不限精度类型，以免导致编译期间过长或内存占用过高。

数字 trait 约束¶

Lumos 的数字泛型能力完全由 trait 约束系统提供。

当函数参数写为 trait 约束时，编译器按约束检查类型能力，而不是按具体位宽做匹配。

基础数字 trait¶

Num：通用数字 trait。

关联函数
- zero 返回该数字类型的零值
- one 返回该数字类型的单位值
运算
- add 加法运算，对应 +
- sub 减法运算，对应 -
- mul 乘法运算，对应 *
- div 除法运算，对应 /

SignedNum : Num：有符号数字 trait。

运算
- neg 取反运算，对应一元 -

Float : SignedNum：浮点数字 trait。

表示实现浮点语义的数字类型

Int : Num：整数 trait。

只能表示整数，不表示实数
运算
- rem 取余运算
- mod 取模运算

BinaryInt : Int：二进制整数 trait。

运算
- shl 左移运算，对应 <<
- shr 右移运算，对应 >>

若移位数大于等于类型位宽，则 shl 与 shr 的结果都为 0。

SizedBinaryInt : BinaryInt：固定位宽二进制整数 trait。

运算
- rol 循环左移运算
- ror 循环右移运算

运算符可用性¶

+ - * / 由 Num 提供。
% 不属于 Num，仅由 Int（及其子 trait）提供。
位移与循环位移仅对 BinaryInt / SizedBinaryInt 可用。

重载与约束选择¶

当多个重载同时匹配时，编译器优先选择“约束更具体”的重载：

SizedBinaryInt
BinaryInt
Int
Float
SignedNum
Num

若仍无法唯一决议，编译报“重载歧义”错误，需通过显式类型标注或类型转换消除歧义。

示例¶

def sum[T: Num](T a, T b) -> T {
    return a + b;
}

def abs[T: SignedNum](T x) -> T {
    if (x < T.zero()) {
        return -x;
    }
    return x;
}

def gcd[T: Int](T a, T b) -> T {
    var T x = a;
    var T y = b;
    while (y != T.zero()) {
        val t = x rem y;
        x = y;
        y = t;
    }
    return x;
}

扩展类型¶

简写	全称	解释
c32	complex float32	32 位浮点复数
c64	complex float64	64 位浮点复数
vec2	vector2 float32	2 维 32 位浮点向量
	vector2 xxx	可接所有数字类型
vec3	vector3 float32	3 维 32 位浮点向量
	vector3 xxx	可接所有数字类型
vec4	vector4 float32	4 维 32 位浮点向量
	vector4 xxx	可接所有数字类型

complex 作为变量修饰符，用于表示复数。（单独存在时代表 complex float32）

高精度扩展¶

简写	全称	解释
MPN	multiple precision natural numbers	大自然数
MPZ	multiple precision integers	大整数
MPQ	multiple precision rational numbers	大有理数
MPF	multiple precision floating-point	大浮点数

这些类型与 int uint float 类似，均为不限精度类型，但它们使用会进行内存分配并且可以在运行时使用。

当前参考实现使用 GMP 作为这些类型的后端实现。其它实现可替换后端，但应保证 MPN MPZ MPQ MPF 的可观测语义一致。

指针类型¶

Lumos 使用 [T] 符号来表示非空指针类型，使用 [T]? 表示可空指针类型。并使用后缀 [] 进行解引用。这种设计统一了指针与数组的语义。

i32 a = 1;
[i32] b = &a;  // b 是一个指向 i32 的非空指针
[i32]? c = b;  // c 是一个指向 i32 的可空指针
i32 d = b[];   // 解引用，将 b 指向的值赋值给 d

注意：[i32] 仅表示一个内存地址，不包含长度信息。

可空指针的空值字面量为 null（表示地址为零的指针）。null 与表示"逻辑上没有值"的 none 是两个独立的概念：null 专属于指针层，none 用于可选值类型（表示值缺席）。非空指针 [T] 禁止赋值 null。

切片类型 (Slice)¶

切片是数组或内存区域的一个动态视图，它在底层是一个“胖指针”（包含一个起始地址和一个长度）。

[10]i32 arr = $[1, 2, 3, 4, 5, 6, 7, 8, 9, 10];
[]i32 s = arr[2..5]; // s 是一个切片，包含 arr 的第 3 到第 5 个元素
println(s.len);      // 输出 3

切片类型 []T 与指针类型 [T] 的区别：

[T]：原始指针，不记录长度，不支持边界检查，解引用为 p[]。
[]T：切片，记录长度，支持 .len 属性，访问元素使用 s[i]，支持安全的边界检查。

引用类型¶

引用使用 &T 符号表示，它在语义上是变量的别名。

i32 a = 1;
&i32 b = a; // b 是 a 的引用

多个返回类型（`variant`）¶

variant 是带标签联合（tagged union），用于表达“一个值在多个分支中二选一/多选一，且每个分支可携带不同类型的数据”。

定位与边界¶

enum：离散值集合（可配 as table 做标签到元数据映射）。
variant：运行时异构数据分支（代数数据类型 / sum type），带命名标签和载荷（同 Rust enum）。
type X = A | B：类型联合，以类型名为隐式标签，无需显式命名分支；若 A 和 B 实现同一接口则联合类型也实现。
union：C 风格联合体，所有字段共享同一段内存，直接 reinterpret 字节，由程序员保证类型安全。

enum ... as table 继续承担“标签 → 元数据”的映射，不承担运行时异构载荷；异构载荷应使用 variant。

定义与构造¶

variant Result {
    Ok(i32),
    Err(string),
}

variant IntOrUnit {
    Int(i32),
    Unit, // 无载荷分支
}

每个分支都由“标签 + 可选载荷类型”组成。
变体值只能通过对应分支构造器创建（如 Result::Ok(200)、Result::Err("bad")）。
同一时刻仅有一个分支处于激活状态。

类型联合（`type`）¶

type 联合是一种隐式标签联合类型：不显式写分支标签，类型名本身就是唯一标签。若 A 和 B 实现了同一接口，则 A | B 也实现该接口。

type IntOrUnit = i32 | unit;

def foo(i32 arg) -> IntOrUnit {
    if (arg < 0) {
        return unit;
    }
    return arg;
}

val a: IntOrUnit = 1;
val b: IntOrUnit = unit;

分支类型必须互不相同（按类型判等）；不允许同一类型出现多次。
类型判等按完整类型计算，例如 [i32] 与 [i32]? 视为不同；类型别名按展开后判等。
构造无需显式标签，直接使用分支类型的值即可。
match 时以类型名作为标签；可用 TypeName(name) 进行解构绑定。
载荷访问规则与 variant 相同：读取前必须先完成分支判定。
内存布局与 variant 一致，判别值为“类型标签”。

联合体（`union`）¶

union 是 C 风格联合体：所有字段共享同一段内存，对一个字段写入后从另一字段读取会直接 reinterpret 底层字节。

union IntOrFloat {
    i32 int_val,
    f32 float_val,
}

act[io.out] main() {
    var union IntOrFloat u;
    u.int_val = 42;
    println(u.float_val); // reinterpret i32 的字节为 f32
}

共享内存：所有字段的起始地址相同，大小为最大字段的大小。
类型安全由程序员保证：读取的字段类型必须与最后一次写入的字段类型一致，否则结果为未定义（UB）。
对齐规则：union 的对齐为其所有字段的最大对齐值。
不可包含引用类型：&T 字段不允许出现在 union 中，以免悬挂引用。
与 variant 的区别：variant 带判别值（tag），保证类型安全；union 无判别值，性能更高但需程序员自行保证正确性。

类型规则¶

读取载荷前必须先完成分支判定（通常通过 match）。
未判定分支时，禁止直接读取某个分支的载荷。
对于无载荷分支，只能做标签级匹配，不存在可解构的数据字段。

与 `match` 的关系¶

variant 的分支处理应优先使用 match。match 对 variant 需要穷尽所有分支，或显式写 else 兜底。

def parse(i32 code) -> Result {
    if (code == 0) {
        return Result::Ok(42);
    }
    return Result::Err("parse failed");
}

act[io.out] main() {
    val r = parse(1);
    match (r) {
        Result::Ok(v): {
            println(`ok: $v`);
        }
        Result::Err(e): {
            println(`err: $e`);
        }
    }
}

内存模型¶

variant 的默认布局为“判别值（discriminant） + 最大分支载荷”：

判别值标记当前激活分支；
载荷区大小按各分支载荷最大者确定；
保证类型安全优先，再考虑可选优化（例如 niche 优化）。

在错误处理中的推荐用法¶

Result / Option 一类“成功/失败、存在/缺席”模型建议优先使用 variant 表达，并与：

match（穷尽处理）
-> T or E（值级错误返回）
act[exn]（异常传播）

形成分层：可恢复分支优先值级建模，不可恢复流程再使用异常机制。

变量声明规范¶

Lumos 提供了四种不同的变量修饰符，用于精确控制变量的可变性和内存行为。

完全可变 (var)：

var i32 a = 10; (隐含 mut)

逻辑不可变 (val / 默认)：

i32 b = 20; (等同于 val i32 b)

物理不可变 (imv)：

imv i32 c = 30; (隐含 imm)

编译期常量 (lit)：

lit i32 d = 40;

var i32 a = 10;      // 完全可变
i32 b = 20;          // 逻辑不可变
imv i32 c = 30;      // 物理不可变
lit i32 d = 40;      // 编译期常量
fin e = 50;          // 禁止重新绑定

注意：var 隐含了 mut，imv 隐含了 imm。重复书写会导致编译错误。此外，逻辑不可变（val）或物理不可变（imv）变量不能被隐式默认初始化，必须在声明时或构造函数中明确初始化。

类型转换¶

Lumos 仅支持 expr as T 格式的显式类型转换。不支持 C 风格的强制转换。

指针不能和任何非指针类型转换。

=（包括初始化与后续赋值）只执行无损隐式转换；可能有损的转换必须使用 as 显式写出。

编译期常量在初始化与赋值中的转换也遵循同样规则：无损可隐式，可能有损则报错并要求显式处理。

i32 a = 1;
f32 b = a as f32; // 显式转换
b = 3.0;          // 隐式转换

类型别名¶

use MyInt = i32;

比较类型¶

使用 is !is 运算符来比较类型是否相同。用法为 变量 is 类型 类型 is 类型，此处的类型可以为类型别名。

val a = 1;
if (a is i32) {
    println("a is i32.");
} else {
    println("a is not i32.");
}

类型属性¶

@limit(最小值, 最大值) 限制数值的范围。

类型修饰¶

所有类型遵循，修饰在前，基本类型在后的规则。

[i32]  // 指向 i32 的非空指针
[i32]? // 指向 i32 的可空指针
[]i32  // i32 的切片
&i32   // i32 的引用

指定初始化值¶

i32(10) // 默认初始化为 10 的 i32 类型

${10_i32} // 默认初始化为 10 的 i32 类型

数组¶

[10]i32     // 10 个 i32 类型组成的数组
[20][10]i32 // 20 乘 10 个 i32 类型组成的数组

类型内置成员¶

所有数字类型都拥有一系列内置的静态成员，用于获取该类型的元数据和常用数学常量。

数字类型共有成员¶

成员	说明
`RADIX`	进制基数 (通常为 2)
`ZERO`	零值
`ONE`	单位值

整数类型成员¶

对整数类型实现以下属性成员：

成员	说明
`BITS`	类型位宽常量 (如 `i32.BITS` 为 32)
`BYTES`	类型字节宽常量
`SIGNED`	布尔常量，表示该整数类型是否为有符号整数
`RADIX`	进制基数常量 (通常为 2)
`MIN`	该类型能表示的最小值常量
`MAX`	该类型能表示的最大值常量

同时实现以下数学常量成员：

成员	说明
`ZERO`	整数类型的零值常量
`ONE`	整数类型的单位值常量

可以这样使用：

println("i32 的最大值为: ", i32.MAX);
println("i32 是否有符号: ", i32.SIGNED);

浮点类型成员¶

对于浮点类型实现以下属性成员：

成员	说明
`BITS`	浮点类型的位宽常量
`BYTES`	浮点类型的字节宽常量
`RADIX`	进制基数常量
`DIGITS`	十进制有效数字位数
`MIN`	最小有限负数值常量
`MAX`	最大有限正数值常量
`MIN_POSITIVE`	最小正正规数常量
`EPSILON`	浮点类型的最小正数常量 (1.0 与下一个可表示值之差)
`NAN`	浮点类型的 NaN 常量
`INF`	浮点类型的正无穷大常量
`NEG_INF`	浮点类型的负无穷大常量