Tìm kiếm theo chiều sâu (Depth First Search)¶

Tìm kiếm theo chiều sâu (Depth First Search - DFS) là một trong những thuật toán đồ thị chính.

Tìm kiếm theo chiều sâu tìm đường đi đầu tiên theo thứ tự từ điển trong đồ thị từ một đỉnh nguồn $u$ đến mỗi đỉnh. Tìm kiếm theo chiều sâu cũng sẽ tìm đường đi ngắn nhất trong một cây (vì chỉ tồn tại một đường đi đơn), nhưng trên các đồ thị tổng quát thì không phải vậy.

Thuật toán hoạt động trong thời gian $O(m + n)$ trong đó $n$ là số lượng đỉnh và $m$ là số lượng cạnh.

Mô tả thuật toán (Description of the algorithm)¶

Ý tưởng đằng sau DFS là đi sâu vào đồ thị nhất có thể, và quay lui (backtrack) khi bạn ở tại một đỉnh không có bất kỳ đỉnh kề nào chưa được thăm.

Rất dễ để mô tả / cài đặt thuật toán một cách đệ quy: Chúng ta bắt đầu tìm kiếm tại một đỉnh. Sau khi thăm một đỉnh, chúng ta tiếp tục thực hiện DFS cho mỗi đỉnh kề mà chúng ta chưa thăm trước đó. Bằng cách này, chúng ta thăm tất cả các đỉnh có thể đến được từ đỉnh bắt đầu.

Để biết thêm chi tiết, hãy xem phần cài đặt.

Ứng dụng của Tìm kiếm theo chiều sâu (Applications of Depth First Search)¶

Tìm bất kỳ đường đi nào trong đồ thị từ đỉnh nguồn $u$ đến tất cả các đỉnh.
Tìm đường đi đầu tiên theo thứ tự từ điển trong đồ thị từ nguồn $u$ đến tất cả các đỉnh.
Kiểm tra xem một đỉnh trong cây có phải là tổ tiên của một số đỉnh khác hay không:

Ở đầu và cuối mỗi cuộc gọi tìm kiếm, chúng ta ghi nhớ "thời gian" vào (entry) và ra (exit) của mỗi đỉnh. Bây giờ bạn có thể tìm câu trả lời cho bất kỳ cặp đỉnh $(i, j)$ nào trong $O(1)$: đỉnh $i$ là tổ tiên của đỉnh $j$ khi và chỉ khi $\text{entry}[i] < \text{entry}[j]$ và $\text{exit}[i] > \text{exit}[j]$.
Tìm tổ tiên chung thấp nhất (LCA) của hai đỉnh.
Sắp xếp topo (Topological sorting):

Chạy một loạt các tìm kiếm theo chiều sâu để thăm mỗi đỉnh chính xác một lần trong thời gian $O(n + m)$. Thứ tự topo cần tìm sẽ là các đỉnh được sắp xếp theo thứ tự giảm dần của thời gian ra (exit time).
Kiểm tra xem một đồ thị đã cho có phải là không có chu trình (acyclic) hay không và tìm các chu trình trong một đồ thị. (Như đã đề cập bên dưới bằng cách đếm các cạnh ngược trong mọi thành phần liên thông).
Tìm các thành phần liên thông mạnh trong một đồ thị có hướng:

Đầu tiên thực hiện sắp xếp topo của đồ thị. Sau đó chuyển vị đồ thị và chạy một loạt các tìm kiếm theo chiều sâu khác theo thứ tự được định nghĩa bởi sắp xếp topo. Đối với mỗi cuộc gọi DFS, thành phần được tạo bởi nó là một thành phần liên thông mạnh.
Tìm cầu (bridges) trong một đồ thị vô hướng:

Đầu tiên chuyển đổi đồ thị đã cho thành đồ thị có hướng bằng cách chạy một loạt các tìm kiếm theo chiều sâu và làm cho mỗi cạnh có hướng khi chúng ta đi qua nó, theo hướng chúng ta đã đi. Thứ hai, tìm các thành phần liên thông mạnh trong đồ thị có hướng này. Cầu là những cạnh mà các đầu của nó thuộc về các thành phần liên thông mạnh khác nhau.

Phân loại các cạnh của đồ thị (Classification of edges of a graph)¶

Chúng ta có thể phân loại các cạnh của một đồ thị, $G$, bằng cách sử dụng thời gian vào và ra của các nút đầu cuối $u$ và $v$ của các cạnh $(u,v)$. Các phân loại này thường được sử dụng cho các bài toán như tìm cầu và tìm khớp.

Chúng ta thực hiện một DFS và phân loại các cạnh gặp phải bằng cách sử dụng các quy tắc sau:

Nếu $v$ chưa được thăm:

Cạnh cây (Tree Edge) - Nếu $v$ được thăm sau $u$ thì cạnh $(u,v)$ được gọi là cạnh cây. Nói cách khác, nếu $v$ được thăm lần đầu tiên và $u$ hiện đang được thăm thì $(u,v)$ được gọi là cạnh cây. Các cạnh này tạo thành một cây DFS và do đó có tên là cạnh cây.

Nếu $v$ được thăm trước $u$:

Cạnh ngược (Back edge) - Nếu $v$ là tổ tiên của $u$, thì cạnh $(u,v)$ là một cạnh ngược. $v$ là tổ tiên chính xác nếu chúng ta đã vào $v$, nhưng chưa ra khỏi nó. Các cạnh ngược hoàn thành một chu trình vì có một đường đi từ tổ tiên $v$ đến hậu duệ $u$ (trong đệ quy của DFS) và một cạnh từ hậu duệ $u$ đến tổ tiên $v$ (cạnh ngược), do đó một chu trình được hình thành. Các chu trình có thể được phát hiện bằng cách sử dụng các cạnh ngược.
Cạnh xuôi (Forward Edge) - Nếu $v$ là hậu duệ của $u$, thì cạnh $(u, v)$ là một cạnh xuôi. Nói cách khác, nếu chúng ta đã thăm và ra khỏi $v$ và $\text{entry}[u] < \text{entry}[v]$ thì cạnh $(u,v)$ tạo thành một cạnh xuôi.
Cạnh chéo (Cross Edge): nếu $v$ không phải là tổ tiên cũng không phải là hậu duệ của $u$, thì cạnh $(u, v)$ là một cạnh chéo. Nói cách khác, nếu chúng ta đã thăm và ra khỏi $v$ và $\text{entry}[u] > \text{entry}[v]$ thì $(u,v)$ là một cạnh chéo.

Định lý. Cho $G$ là một đồ thị vô hướng. Khi đó, việc thực hiện một DFS trên $G$ sẽ phân loại mọi cạnh gặp phải là cạnh cây hoặc cạnh ngược, tức là, các cạnh xuôi và cạnh chéo chỉ tồn tại trong các đồ thị có hướng.

Giả sử $(u,v)$ là một cạnh tùy ý của $G$ và không mất tính tổng quát, $u$ được thăm trước $v$, tức là, $\text{entry}[u] < \text{entry}[v]$. Bởi vì DFS chỉ xử lý các cạnh một lần, chỉ có hai cách mà chúng ta có thể xử lý cạnh $(u,v)$ và do đó phân loại nó:

Lần đầu tiên chúng ta khám phá cạnh $(u,v)$ là theo hướng từ $u$ đến $v$. Bởi vì $\text{entry}[u] < \text{entry}[v]$, bản chất đệ quy của DFS có nghĩa là nút $v$ sẽ được khám phá đầy đủ và do đó thoát ra trước khi chúng ta có thể "di chuyển ngược lên ngăn xếp cuộc gọi" để thoát khỏi nút $u$. Do đó, nút $v$ phải chưa được thăm khi DFS lần đầu tiên khám phá cạnh $(u,v)$ từ $u$ đến $v$ vì nếu không, việc tìm kiếm sẽ khám phá $(u,v)$ từ $v$ đến $u$ trước khi thoát khỏi nút $v$, vì các nút $u$ và $v$ là hàng xóm. Do đó, cạnh $(u,v)$ là một cạnh cây.
Lần đầu tiên chúng ta khám phá cạnh $(u,v)$ là theo hướng từ $v$ đến $u$. Bởi vì chúng ta đã phát hiện ra nút $u$ trước khi phát hiện ra nút $v$, và chúng ta chỉ xử lý các cạnh một lần, cách duy nhất mà chúng ta có thể khám phá cạnh $(u,v)$ theo hướng từ $v$ đến $u$ là nếu có một đường đi khác từ $u$ đến $v$ không liên quan đến cạnh $(u,v)$, do đó làm cho $u$ trở thành tổ tiên của $v$. Cạnh $(u,v)$ do đó hoàn thành một chu trình vì nó đi từ hậu duệ, $v$, đến tổ tiên, $u$, mà chúng ta chưa thoát ra. Do đó, cạnh $(u,v)$ là một cạnh ngược.

Vì chỉ có hai cách để xử lý cạnh $(u,v)$, với hai trường hợp và các phân loại kết quả của chúng được phác thảo ở trên, việc thực hiện một DFS trên $G$ do đó sẽ phân loại mọi cạnh gặp phải là cạnh cây hoặc cạnh ngược, tức là, các cạnh xuôi và cạnh chéo chỉ tồn tại trong các đồ thị có hướng. Điều này hoàn thành chứng minh.

Cài đặt (Implementation)¶

vector<vector<int>> adj; // biểu diễn đồ thị dưới dạng danh sách kề
int n; // số lượng đỉnh

vector<bool> visited;

void dfs(int v) {
    visited[v] = true;
    for (int u : adj[v]) {
        if (!visited[u])
            dfs(u);
    }
}

Đây là cài đặt đơn giản nhất của Tìm kiếm theo chiều sâu. Như được mô tả trong các ứng dụng, có thể hữu ích khi tính toán thêm thời gian vào và ra và màu của đỉnh. Chúng ta sẽ tô màu tất cả các đỉnh với màu 0, nếu chúng ta chưa thăm chúng, với màu 1 nếu chúng ta đã thăm chúng, và với màu 2, nếu chúng ta đã ra khỏi đỉnh.

Dưới đây là một cài đặt chung tính toán thêm những thứ đó:

vector<vector<int>> adj; // biểu diễn đồ thị dưới dạng danh sách kề
int n; // số lượng đỉnh

vector<int> color;

vector<int> time_in, time_out;
int dfs_timer = 0;

void dfs(int v) {
    time_in[v] = dfs_timer++;
    color[v] = 1;
    for (int u : adj[v])
        if (color[u] == 0)
            dfs(u);
    color[v] = 2;
    time_out[v] = dfs_timer++;
}

Tìm kiếm theo chiều sâu (Depth First Search)¶

Mô tả thuật toán (Description of the algorithm)¶

Ứng dụng của Tìm kiếm theo chiều sâu (Applications of Depth First Search)¶

Phân loại các cạnh của đồ thị (Classification of edges of a graph)¶

Cài đặt (Implementation)¶

Bài tập (Practice Problems)¶