数据结构知识点笔记：从基础到实战，轻松掌握核心算法与应用技巧

引言

数据结构是计算机科学的核心基础，它决定了数据如何组织、存储和管理。掌握数据结构不仅能提升编程效率，还能帮助我们设计出更高效、更优雅的算法。本文将从基础概念出发，逐步深入到实战应用，通过详细的讲解和代码示例，帮助你系统性地掌握数据结构的核心知识与应用技巧。

1. 数据结构基础概念

1.1 什么是数据结构？

数据结构是计算机存储、组织数据的方式。它不仅仅是数据的集合，还包括数据之间的关系和操作。常见的数据结构包括数组、链表、栈、队列、树、图等。

1.2 数据结构与算法的关系

数据结构是算法的基础，算法是数据结构的应用。例如，二叉搜索树（数据结构）可以用于快速查找（算法）。选择合适的数据结构可以显著提高算法的效率。

1.3 时间复杂度与空间复杂度

时间复杂度：描述算法执行时间随输入规模增长的变化趋势。常用大O表示法，如O(1)、O(n)、O(n²)等。
空间复杂度：描述算法执行过程中所需内存空间随输入规模增长的变化趋势。

示例：计算数组元素之和的时间复杂度为O(n)，因为需要遍历每个元素。

2. 线性数据结构

2.1 数组（Array）

数组是最基本的数据结构，它在内存中连续存储相同类型的元素。

特点：

支持随机访问，时间复杂度O(1)
插入和删除操作可能需要移动元素，时间复杂度O(n)
固定大小（静态数组）或动态调整（动态数组）

代码示例（Python）：

# 创建数组
arr = [1, 2, 3, 4, 5]

# 访问元素
print(arr[2])  # 输出: 3

# 插入元素（在末尾）
arr.append(6)
print(arr)  # 输出: [1, 2, 3, 4, 5, 6]

# 删除元素
arr.pop(2)
print(arr)  # 输出: [1, 2, 4, 5, 6]

2.2 链表（Linked List）

链表由节点组成，每个节点包含数据和指向下一个节点的指针。

类型：

单向链表
双向链表
循环链表

特点：

插入和删除操作高效，时间复杂度O(1)（已知位置）
不支持随机访问，时间复杂度O(n)
动态大小，内存不连续

代码示例（Python）：

class Node:
    def __init__(self, data):
        self.data = data
        self.next = None

class LinkedList:
    def __init__(self):
        self.head = None
    
    def append(self, data):
        new_node = Node(data)
        if not self.head:
            self.head = new_node
            return
        last = self.head
        while last.next:
            last = last.next
        last.next = new_node
    
    def display(self):
        current = self.head
        while current:
            print(current.data, end=" -> ")
            current = current.next
        print("None")

# 使用示例
ll = LinkedList()
ll.append(1)
ll.append(2)
ll.append(3)
ll.display()  # 输出: 1 -> 2 -> 3 -> None

2.3 栈（Stack）

栈是一种后进先出（LIFO）的数据结构。

操作：

push：入栈
pop：出栈
peek：查看栈顶元素

应用场景：

函数调用栈
表达式求值
括号匹配

代码示例（Python）：

class Stack:
    def __init__(self):
        self.items = []
    
    def push(self, item):
        self.items.append(item)
    
    def pop(self):
        if not self.is_empty():
            return self.items.pop()
        return None
    
    def peek(self):
        if not self.is_empty():
            return self.items[-1]
        return None
    
    def is_empty(self):
        return len(self.items) == 0

# 使用示例
stack = Stack()
stack.push(10)
stack.push(20)
stack.push(30)
print(stack.pop())  # 输出: 30
print(stack.peek())  # 输出: 20

2.4 队列（Queue）

队列是一种先进先出（FIFO）的数据结构。

操作：

enqueue：入队
dequeue：出队
front：查看队首元素

应用场景：

任务调度
缓冲区管理
广度优先搜索

代码示例（Python）：

class Queue:
    def __init__(self):
        self.items = []
    
    def enqueue(self, item):
        self.items.insert(0, item)
    
    def dequeue(self):
        if not self.is_empty():
            return self.items.pop()
        return None
    
    def front(self):
        if not self.is_empty():
            return self.items[-1]
        return None
    
    def is_empty(self):
        return len(self.items) == 0

# 使用示例
queue = Queue()
queue.enqueue(10)
queue.enqueue(20)
queue.enqueue(30)
print(queue.dequeue())  # 输出: 10
print(queue.front())    # 输出: 20

3. 非线性数据结构

3.1 树（Tree）

树是一种分层数据结构，由节点和边组成。

基本概念：

根节点：树的顶部节点
子节点：节点的直接下级
叶子节点：没有子节点的节点
深度：从根节点到该节点的边数

二叉树：每个节点最多有两个子节点（左子节点和右子节点）。

代码示例（Python）：

class TreeNode:
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None

class BinaryTree:
    def __init__(self):
        self.root = None
    
    def insert(self, value):
        if not self.root:
            self.root = TreeNode(value)
        else:
            self._insert_recursive(self.root, value)
    
    def _insert_recursive(self, node, value):
        if value < node.value:
            if node.left is None:
                node.left = TreeNode(value)
            else:
                self._insert_recursive(node.left, value)
        else:
            if node.right is None:
                node.right = TreeNode(value)
            else:
                self._insert_recursive(node.right, value)
    
    def inorder_traversal(self, node):
        if node:
            self.inorder_traversal(node.left)
            print(node.value, end=" ")
            self.inorder_traversal(node.right)

# 使用示例
bt = BinaryTree()
bt.insert(5)
bt.insert(3)
bt.insert(7)
bt.insert(2)
bt.insert(4)
bt.inorder_traversal(bt.root)  # 输出: 2 3 4 5 7

3.2 二叉搜索树（BST）

二叉搜索树是一种特殊的二叉树，满足以下性质：

左子树所有节点值小于根节点值
右子树所有节点值大于根节点值
左右子树也分别是二叉搜索树

操作：

查找：平均时间复杂度O(log n)，最坏O(n)
插入：平均时间复杂度O(log n)，最坏O(n)
删除：平均时间复杂度O(log n)，最坏O(n)

代码示例（Python）：

class BSTNode:
    def __init__(self, key):
        self.key = key
        self.left = None
        self.right = None

class BinarySearchTree:
    def __init__(self):
        self.root = None
    
    def insert(self, key):
        self.root = self._insert_recursive(self.root, key)
    
    def _insert_recursive(self, node, key):
        if node is None:
            return BSTNode(key)
        if key < node.key:
            node.left = self._insert_recursive(node.left, key)
        elif key > node.key:
            node.right = self._insert_recursive(node.right, key)
        return node
    
    def search(self, key):
        return self._search_recursive(self.root, key)
    
    def _search_recursive(self, node, key):
        if node is None or node.key == key:
            return node
        if key < node.key:
            return self._search_recursive(node.left, key)
        return self._search_recursive(node.right, key)
    
    def delete(self, key):
        self.root = self._delete_recursive(self.root, key)
    
    def _delete_recursive(self, node, key):
        if node is None:
            return node
        if key < node.key:
            node.left = self._delete_recursive(node.left, key)
        elif key > node.key:
            node.right = self._delete_recursive(node.right, key)
        else:
            # 节点只有一个子节点或没有子节点
            if node.left is None:
                return node.right
            elif node.right is None:
                return node.left
            # 节点有两个子节点
            temp = self._min_value_node(node.right)
            node.key = temp.key
            node.right = self._delete_recursive(node.right, temp.key)
        return node
    
    def _min_value_node(self, node):
        current = node
        while current.left:
            current = current.left
        return current

# 使用示例
bst = BinarySearchTree()
keys = [50, 30, 70, 20, 40, 60, 80]
for key in keys:
    bst.insert(key)

# 查找
result = bst.search(40)
print(f"查找40: {result.key if result else 'Not found'}")

# 删除
bst.delete(30)
print("删除30后的中序遍历:")
bst.inorder_traversal(bst.root)  # 需要实现中序遍历方法

3.3 图（Graph）

图由顶点（节点）和边组成，用于表示实体之间的关系。

类型：

有向图 vs 无向图
加权图 vs 非加权图
连通图 vs 非连通图

表示方法：

邻接矩阵：二维数组，空间复杂度O(V²)
邻接表：数组+链表，空间复杂度O(V+E)

代码示例（Python）：

class Graph:
    def __init__(self, directed=False):
        self.adjacency_list = {}
        self.directed = directed
    
    def add_vertex(self, vertex):
        if vertex not in self.adjacency_list:
            self.adjacency_list[vertex] = []
    
    def add_edge(self, vertex1, vertex2, weight=1):
        self.add_vertex(vertex1)
        self.add_vertex(vertex2)
        self.adjacency_list[vertex1].append((vertex2, weight))
        if not self.directed:
            self.adjacency_list[vertex2].append((vertex1, weight))
    
    def display(self):
        for vertex, edges in self.adjacency_list.items():
            print(f"{vertex} -> {edges}")

# 使用示例
graph = Graph()
graph.add_edge('A', 'B')
graph.add_edge('A', 'C')
graph.add_edge('B', 'D')
graph.add_edge('C', 'D')
graph.display()

4. 高级数据结构

4.1 堆（Heap）

堆是一种特殊的树形数据结构，满足堆属性：

最大堆：父节点值 ≥ 子节点值
最小堆：父节点值 ≤ 子节点值

应用场景：

优先队列
堆排序
Top K问题

代码示例（Python）：

import heapq

class MinHeap:
    def __init__(self):
        self.heap = []
    
    def push(self, value):
        heapq.heappush(self.heap, value)
    
    def pop(self):
        return heapq.heappop(self.heap)
    
    def peek(self):
        return self.heap[0] if self.heap else None
    
    def size(self):
        return len(self.heap)

# 使用示例
heap = MinHeap()
heap.push(5)
heap.push(2)
heap.push(8)
heap.push(1)
print(heap.pop())  # 输出: 1
print(heap.pop())  # 输出: 2

4.2 哈希表（Hash Table）

哈希表通过哈希函数将键映射到值，实现快速查找。

核心概念：

哈希函数：将键转换为索引
冲突解决：链地址法、开放地址法
负载因子：元素数量/桶数量

代码示例（Python）：

class HashTable:
    def __init__(self, size=10):
        self.size = size
        self.table = [[] for _ in range(size)]
    
    def _hash(self, key):
        return hash(key) % self.size
    
    def insert(self, key, value):
        index = self._hash(key)
        for i, (k, v) in enumerate(self.table[index]):
            if k == key:
                self.table[index][i] = (key, value)
                return
        self.table[index].append((key, value))
    
    def get(self, key):
        index = self._hash(key)
        for k, v in self.table[index]:
            if k == key:
                return v
        return None
    
    def delete(self, key):
        index = self._hash(key)
        for i, (k, v) in enumerate(self.table[index]):
            if k == key:
                del self.table[index][i]
                return

# 使用示例
ht = HashTable()
ht.insert("name", "Alice")
ht.insert("age", 25)
print(ht.get("name"))  # 输出: Alice
print(ht.get("age"))   # 输出: 25

4.3 并查集（Union-Find）

并查集用于处理动态连通性问题，支持两种操作：

find：确定元素属于哪个集合
union：合并两个集合

优化：

路径压缩
按秩合并

代码示例（Python）：

class UnionFind:
    def __init__(self, n):
        self.parent = list(range(n))
        self.rank = [0] * n
    
    def find(self, x):
        if self.parent[x] != x:
            self.parent[x] = self.find(self.parent[x])  # 路径压缩
        return self.parent[x]
    
    def union(self, x, y):
        root_x = self.find(x)
        root_y = self.find(y)
        if root_x == root_y:
            return
        # 按秩合并
        if self.rank[root_x] < self.rank[root_y]:
            self.parent[root_x] = root_y
        elif self.rank[root_x] > self.rank[root_y]:
            self.parent[root_y] = root_x
        else:
            self.parent[root_y] = root_x
            self.rank[root_x] += 1

# 使用示例
uf = UnionFind(10)
uf.union(1, 2)
uf.union(2, 3)
print(uf.find(1))  # 输出: 3
print(uf.find(3))  # 输出: 3

5. 实战应用与算法

5.1 排序算法

排序是数据结构的重要应用，常见算法包括：

冒泡排序（时间复杂度O(n²)）：

def bubble_sort(arr):
    n = len(arr)
    for i in range(n):
        for j in range(0, n-i-1):
            if arr[j] > arr[j+1]:
                arr[j], arr[j+1] = arr[j+1], arr[j]
    return arr

# 使用示例
arr = [64, 34, 25, 12, 22, 11, 90]
print(bubble_sort(arr))  # 输出: [11, 12, 22, 25, 34, 64, 90]

快速排序（时间复杂度O(n log n)）：

def quick_sort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quick_sort(left) + middle + quick_sort(right)

# 使用示例
arr = [64, 34, 25, 12, 22, 11, 90]
print(quick_sort(arr))  # 输出: [11, 12, 22, 25, 34, 64, 90]

5.2 搜索算法

二分查找（时间复杂度O(log n)）：

def binary_search(arr, target):
    left, right = 0, len(arr) - 1
    while left <= right:
        mid = (left + right) // 2
        if arr[mid] == target:
            return mid
        elif arr[mid] < target:
            left = mid + 1
        else:
            right = mid - 1
    return -1

# 使用示例
arr = [1, 3, 5, 7, 9, 11, 13, 15]
print(binary_search(arr, 7))  # 输出: 3

5.3 图算法

广度优先搜索（BFS）：

from collections import deque

def bfs(graph, start):
    visited = set()
    queue = deque([start])
    visited.add(start)
    result = []
    
    while queue:
        vertex = queue.popleft()
        result.append(vertex)
        for neighbor in graph[vertex]:
            if neighbor not in visited:
                visited.add(neighbor)
                queue.append(neighbor)
    return result

# 使用示例
graph = {
    'A': ['B', 'C'],
    'B': ['A', 'D'],
    'C': ['A', 'D'],
    'D': ['B', 'C']
}
print(bfs(graph, 'A'))  # 输出: ['A', 'B', 'C', 'D']

深度优先搜索（DFS）：

def dfs(graph, start, visited=None):
    if visited is None:
        visited = set()
    visited.add(start)
    result = [start]
    
    for neighbor in graph[start]:
        if neighbor not in visited:
            result.extend(dfs(graph, neighbor, visited))
    return result

# 使用示例
graph = {
    'A': ['B', 'C'],
    'B': ['A', 'D'],
    'C': ['A', 'D'],
    'D': ['B', 'C']
}
print(dfs(graph, 'A'))  # 输出: ['A', 'B', 'D', 'C']

5.4 动态规划

动态规划常用于解决最优化问题，通过存储子问题的解来避免重复计算。

示例：斐波那契数列：

def fibonacci(n, memo={}):
    if n in memo:
        return memo[n]
    if n <= 2:
        return 1
    memo[n] = fibonacci(n-1, memo) + fibonacci(n-2, memo)
    return memo[n]

# 使用示例
print(fibonacci(10))  # 输出: 55

示例：背包问题：

def knapsack(weights, values, capacity):
    n = len(weights)
    dp = [[0] * (capacity + 1) for _ in range(n + 1)]
    
    for i in range(1, n + 1):
        for w in range(1, capacity + 1):
            if weights[i-1] <= w:
                dp[i][w] = max(values[i-1] + dp[i-1][w-weights[i-1]], dp[i-1][w])
            else:
                dp[i][w] = dp[i-1][w]
    
    return dp[n][capacity]

# 使用示例
weights = [2, 3, 4, 5]
values = [3, 4, 5, 6]
capacity = 8
print(knapsack(weights, values, capacity))  # 输出: 10

6. 实战项目示例

6.1 实现一个简单的缓存系统

使用哈希表和双向链表实现LRU（最近最少使用）缓存。

class Node:
    def __init__(self, key, value):
        self.key = key
        self.value = value
        self.prev = None
        self.next = None

class LRUCache:
    def __init__(self, capacity):
        self.capacity = capacity
        self.cache = {}
        self.head = Node(0, 0)  # 哨兵节点
        self.tail = Node(0, 0)
        self.head.next = self.tail
        self.tail.prev = self.head
    
    def _remove(self, node):
        prev_node = node.prev
        next_node = node.next
        prev_node.next = next_node
        next_node.prev = prev_node
    
    def _add(self, node):
        node.prev = self.head
        node.next = self.head.next
        self.head.next.prev = node
        self.head.next = node
    
    def get(self, key):
        if key in self.cache:
            node = self.cache[key]
            self._remove(node)
            self._add(node)
            return node.value
        return -1
    
    def put(self, key, value):
        if key in self.cache:
            self._remove(self.cache[key])
        new_node = Node(key, value)
        self._add(new_node)
        self.cache[key] = new_node
        
        if len(self.cache) > self.capacity:
            lru_node = self.tail.prev
            self._remove(lru_node)
            del self.cache[lru_node.key]

# 使用示例
cache = LRUCache(2)
cache.put(1, 1)
cache.put(2, 2)
print(cache.get(1))  # 输出: 1
cache.put(3, 3)      # 淘汰key=2
print(cache.get(2))  # 输出: -1

6.2 实现一个简单的数据库索引

使用B树（或B+树）实现数据库索引结构。

class BTreeNode:
    def __init__(self, t):
        self.keys = []
        self.children = []
        self.leaf = True
        self.t = t  # 最小度数

class BTree:
    def __init__(self, t):
        self.root = BTreeNode(t)
        self.t = t
    
    def insert(self, key):
        if len(self.root.keys) == (2 * self.t - 1):
            new_root = BTreeNode(self.t)
            new_root.children.append(self.root)
            new_root.leaf = False
            self._split_child(new_root, 0)
            self.root = new_root
        self._insert_non_full(self.root, key)
    
    def _split_child(self, parent, index):
        t = self.t
        child = parent.children[index]
        new_child = BTreeNode(t)
        new_child.leaf = child.leaf
        
        # 分割键
        mid_key = child.keys[t-1]
        new_child.keys = child.keys[t:]
        child.keys = child.keys[:t-1]
        
        # 分割子节点
        if not child.leaf:
            new_child.children = child.children[t:]
            child.children = child.children[:t]
        
        # 插入新节点
        parent.children.insert(index + 1, new_child)
        parent.keys.insert(index, mid_key)
    
    def _insert_non_full(self, node, key):
        if node.leaf:
            # 插入到叶子节点
            i = len(node.keys) - 1
            node.keys.append(0)
            while i >= 0 and key < node.keys[i]:
                node.keys[i+1] = node.keys[i]
                i -= 1
            node.keys[i+1] = key
        else:
            # 找到合适的子节点
            i = len(node.keys) - 1
            while i >= 0 and key < node.keys[i]:
                i -= 1
            i += 1
            
            # 如果子节点已满，先分裂
            if len(node.children[i].keys) == (2 * self.t - 1):
                self._split_child(node, i)
                if key > node.keys[i]:
                    i += 1
            
            self._insert_non_full(node.children[i], key)

# 使用示例
btree = BTree(3)  # 最小度数为3
keys = [10, 20, 5, 6, 12, 30, 7, 17]
for key in keys:
    btree.insert(key)
print("B树插入完成")

7. 学习建议与资源

7.1 学习路径建议

基础阶段：掌握数组、链表、栈、队列
中级阶段：学习树、图、哈希表
高级阶段：掌握堆、并查集、B树等高级结构
实战阶段：通过算法题和项目巩固知识

7.2 推荐资源

书籍：《算法导论》、《数据结构与算法分析》
在线课程：Coursera算法专项课程、LeetCode
练习平台：LeetCode、牛客网、Codeforces

7.3 常见面试题

反转链表
二叉树的层序遍历
最近最少使用缓存（LRU）
两个栈实现队列
图的最短路径（Dijkstra算法）

8. 总结

数据结构是编程的基石，掌握它们能让你在解决问题时更加游刃有余。从基础的线性结构到复杂的非线性结构，每种数据结构都有其独特的应用场景。通过理论学习和实战练习，你将能够灵活运用这些结构，设计出高效的算法和系统。

记住，数据结构的学习是一个循序渐进的过程。建议从简单结构开始，逐步深入，同时通过大量练习来巩固知识。祝你学习顺利，在数据结构的海洋中畅游！

附录：常用数据结构时间复杂度总结

数据结构	查找	插入	删除	空间复杂度
数组	O(1)	O(n)	O(n)	O(n)
链表	O(n)	O(1)	O(1)	O(n)
栈	O(n)	O(1)	O(1)	O(n)
队列	O(n)	O(1)	O(1)	O(n)
二叉搜索树	O(log n)	O(log n)	O(log n)	O(n)
哈希表	O(1)	O(1)	O(1)	O(n)
堆	O(1)	O(log n)	O(log n)	O(n)
图（邻接表）	O(V+E)	O(1)	O(1)	O(V+E)

通过本文的学习，你应该对数据结构有了全面的认识。接下来，建议你通过实际编码练习来加深理解，逐步提升自己的编程能力。