模板（泛型） - C语言高级技术 - c++编程基础

模板是实现代码复用的重要工具，无论是通过宏还是C++的模板机制，都能在不同层面上为开发者提供灵活的泛型编程方案。本文将深入探讨这两种方法的实现原理、优缺点及适用场景。

在现代编程中，模板是实现代码复用和泛型编程的关键技术。C++通过模板机制提供了一种强大的方式，允许我们编写可以适用于多种类型的数据结构和算法。然而，在C语言中，由于缺乏模板支持，开发者通常采用宏来模拟模板行为，实现类似的泛型能力。本文将介绍两种实现模板的方法：使用宏实现模板和使用不透明指针实现模板，并探讨它们的优缺点。

使用宏实现模板

在C语言中，宏是一种强大的预处理工具，可以用来在编译期生成代码。宏实现的模板方式，本质上是通过对不同类型的代码进行代码生成，从而实现类似C++模板的功能。

宏的声明与实例化

使用宏，我们可以定义一个通用的函数签名，然后通过宏展开的方式，为不同的类型生成具体的函数实现。

#define DECL_ADD(type)                                                  \
  void add_##type(type* dst, type* lhs, type* rhs, unsigned int num);
#define IMPL_ADD(type)                                                  \
  void add_##type(type* dst, type* lhs, type* rhs, unsigned int num) {  \
    for (unsigned int i = 0; i < num; i++) {                            \
      dst[i] = lhs[i] + rhs[i];                                         \
    }                                                                   \
  }

通过 DECL_ADD(int) 和 DECL_ADD(float)，我们可以在编译期为 int 和 float 类型生成具体的函数声明。使用 IMPL_ADD(int) 和 IMPL_ADD(float)，则可以为这些类型生成对应的函数实现。

代码膨胀与性能优化

宏实现的模板会导致代码膨胀，即为每个类型生成一份独立的代码。例如，add_int 和 add_float 是两个完全不同的函数，分别针对 int 和 float 类型。这种代码膨胀在某些情况下是不可避免的，但在一些场景下，可以通过显式实例化来减少。

#define CALL_ADD(type) add_##type

CALL_ADD(int)(dst, lhs, rhs, num);
CALL_ADD(float)(dst, lhs, rhs, num);

使用 gcc -E 命令可以查看宏展开后的代码：

void add_int(int *dst, int *lhs, int *rhs, unsigned int num) {
  for (unsinged int i = 0; i < num; i++) {
    dst[i] = lhs[i] + rhs[i];
  }
}
void add_float(float *dst, float *lhs, float *rhs, unsigned int num) {
  for (unsinged int i = 0; i < num; i++) {
    dst[i] = lhs[i] + rhs[i];
  }
}

可以看到，宏生成了两个完全不同的函数实现。这种代码膨胀在某些情况下会影响性能，特别是当类型数量较多时。为了优化，可以考虑使用更高效的算法或减少宏使用次数。

使用不透明指针实现模板

另一种实现模板的方式是使用不透明指针，这种方式避免了宏导致的代码膨胀，但可能会牺牲一些性能。

不透明指针的定义

不透明指针是指向数据结构的指针，其内容在定义时并不公开。在C语言中，可以通过 void* 来实现不透明指针，因为它可以指向任何类型的数据。

typedef void (add_func_t*)(void*, void*, void*);
void add(void* dst, void* lhs, void* rhs, unsigned int num, unsigned int elem_size, add_func_t func_ptr) {
  char* dst_p = (char*)dst;
  char* lhs_p = (char*)lhs;
  char* rhs_p = (char*)rhs;
  for (unsigned int i = 0; i < num; i++) {
    func_ptr(dst_p, lhs_p, rhs_p);
    dst_p += elem_size;
    lhs_p += elem_size;
    rhs_p += elem_size;
  }
}

函数实现

为了使用不透明指针，我们需要为每种类型编写对应的函数实现：

void add_int(void* dst, void* lhs, void* rhs) {
  *(int*)dst = *(int*)lhs + *(int*)rhs;
}
void add_float(void* dst, void* lhs, void* rhs) {
  *(float*)dst = *(float*)lhs + *(float*)rhs;
}

调用示例

调用方式如下：

add(dst, lhs, rhs, num, sizeof(int), add_int);
add(dst, lhs, rhs, num, sizeof(float), add_float);

这种方式的优点是避免了代码膨胀，因为所有的类型操作都通过统一的 add 函数来处理，而不是为每个类型生成单独的函数。然而，缺点是性能可能受到影响，因为不透明指针通常需要通过指针算术和类型转换来访问数据，这可能会导致原本可以在寄存器上完成的计算被转移到栈上。

侵入式容器：一种泛型实现方式

在C语言中，实现泛型容器通常需要侵入式设计，即在数据结构中嵌入通用的链接信息。这种方式虽然不是真正的模板，但能够提供较好的泛型能力。

普通链表的限制

普通链表的结构通常是：

struct node
{    
    int data;
    struct node* next;
}

这种链表的缺点是：

所有节点的数据类型必须一致；
操作如插入、删除等只能针对这种特定类型的链表；
泛化能力差，难以适应不同类型的数据。

侵入式链表的优势

侵入式链表的结构是：

typedef struct link
{
    struct link* next;
} list_t;

typedef struct
{
    int data;
    struct link* list;
} node;

这种设计允许节点类型不一致，只需包含 list_t 成员即可。此外，所有的链表操作都可以统一实现，提高了代码的复用性和灵活性。

访问侵入式链表中的数据

在侵入式链表中，访问数据需要使用 offsetof 和 container_of 宏。这些宏可以帮助我们从指针定位到结构体成员，并进一步获取数据。

#define list_entry(node, type, member) \
    container_of(node, type, member)

// 下面这些api都是通用的，无论data是数据类型
#define list_for_each(pos, head) \
    for (pos = (head)->next; pos != (head); pos = pos->next)

例如，如果我们有一个 list_t 指针 link_p，并且知道它指向的是 struct node 类型的节点，那么可以通过以下方式获取数据：

struct node
{    
    int data;
    list_t link;
}
list_t link_p;
int val = list_entry(link_p, struct node, link)->data;

通用链表操作函数

侵入式链表的通用操作函数包括：

list_init(list_t* list)：初始化链表；
list_insert_after(list_t* list, list_t* node)：在链表中插入节点；
list_insert_before(list_t* list, list_t* node)：在链表中插入节点；
list_remove(list_t* node)：从链表中移除节点；
list_isempty(const list_t* list)：检查链表是否为空；
list_size(const list_t* list)：获取链表的大小。

这些函数的实现是通用的，无论节点的数据类型是什么，都可以使用相同的函数。

void list_init(list_t* list)
{
    list->next = list->prev = list;
}

void list_insert_after(list_t* list, list_t* node)
{
    list->next->prev = node;
    node->next = list->next;

    list->next = node;
    node->prev = list;
}

void list_insert_before(list_t* list, list_t* node) 
{
    list->prev->next = node;
    node->prev = list->prev;
    list->prev = node;
    node->next = list;
}

void list_remove(list_t* node)
{
    node->next->prev = node->prev;
    node->prev->next = node->next;

    node->next = node->prev = node;
}

int list_isempty(const list_t* list)
{
    return list->next == list;
}

unsigned int list_size(const list_t* list)
{
    unsigned int size = 0;
    const list_t* p = list;
    while (p->next != list)
    {
        p = p->next;
        size++;
    }
    return size;
}

不透明指针与宏的对比分析

在C语言中，宏和不透明指针是两种实现模板的常见方式。它们各有优劣，适用于不同的场景。

宏的优点与缺点

优点：

代码生成：宏可以在编译期为不同的类型生成代码，实现高度的类型特化；
灵活性：通过宏可以实现复杂的类型操作和条件编译。

缺点：

代码膨胀：为每个类型生成的代码是独立的，可能导致内存占用增加；
难以维护：宏的展开方式可能导致代码难以理解和维护。

不透明指针的优势与挑战

优势：

避免代码膨胀：不透明指针可以通过统一的接口处理不同类型的操作；
提高可读性：宏展开后的代码可能难以阅读，而不透明指针的实现更清晰。

挑战：

性能问题：使用不透明指针可能导致性能下降，因为需要额外的类型转换和指针算术；
类型安全下降：不透明指针可能会带来类型安全方面的问题，需要开发者更加谨慎地处理指针操作。

泛型编程的实践与建议

在实际开发中，选择使用宏还是不透明指针取决于具体的需求和性能考量。宏更适合需要高度类型特化的场景，而不透明指针更适合需要统一接口和避免代码膨胀的场景。

宏的使用建议

类型特化：宏适合需要为不同类型编写特定实现的场景；
条件编译：宏可以结合条件编译实现更复杂的逻辑；
代码维护：尽量避免宏的过度使用，以提高代码的可维护性。

不透明指针的使用建议

统一接口：使用不透明指针可以实现统一的接口，便于维护和扩展；
性能优化：在性能敏感的场景中，可以考虑使用不透明指针来优化代码；
类型安全：需要注意类型转换和指针操作的安全性，避免潜在的错误。

总结

在C语言中，实现泛型编程的方式多种多样，宏和不透明指针是最常见的两种方法。宏可以在编译期生成类型特定的代码，适用于需要高度类型特化的场景；而不透明指针则提供了一种统一的接口，适用于需要避免代码膨胀的场景。无论选择哪种方式，都需要在代码的可读性、可维护性和性能之间做出权衡，以实现最佳的开发体验。

关键字列表：
C语言, 宏, 不透明指针, 泛型编程, 代码膨胀, 类型特化, 链表, 侵入式设计, container_of, offsetof