Skip to main content

Table 4 Model architecture in terms of convolutional layers and pooling layers for each model used in this research

From: Semantic segmentation and photogrammetry of crowdsourced images to monitor historic facades

  Model1 Model2 Model3 Two-stage model
Backbone \(\begin{bmatrix}\begin{bmatrix} (7\times 7 ;s=2 ;r=1),\ 64 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=2 ;r=1),\ 32 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (7\times 7 ;s=2 ;r=1),\ 64 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (7\times 7 ;s=2 ;r=1),\ 64 \end{bmatrix} \times 1\end{bmatrix}\)
\(\begin{bmatrix}MaxPool2d(3\times 3 ;s=2 ;r=1)\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 64 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}MaxPool2d(3\times 3 ;s=2 ;r=1)\end{bmatrix}\) \(\begin{bmatrix}MaxPool2d(3\times 3 ;s=2 ;r=1)\end{bmatrix}\)
\(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 64 \end{bmatrix} \times 3 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 64 \end{bmatrix} \times 3 \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 4\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=2 ;r=1),\ 128 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 64 \end{bmatrix} \times 3 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 64 \end{bmatrix} \times 3 \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 4\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 64 \end{bmatrix} \times 3 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 64 \end{bmatrix} \times 3 \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 4\end{bmatrix}\)
\(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 128 \end{bmatrix} \times 4 \\ \begin{bmatrix} (3\times 3 ;s=2 ;r=1),\ 128 \end{bmatrix} \times 1 \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 512 \end{bmatrix} \times 4 \\ \begin{bmatrix} (1\times 1 ;s=2 ;r=1),\ 512 \end{bmatrix} \times 1 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 128 \end{bmatrix} \times 3\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 64 \\ (1\times 1 ;s=1 ;r=1),\ 128 \end{bmatrix} \times 1 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 128 \\ (1\times 1 ;s=1 ;r=1),\ 128 \end{bmatrix} \times 1 \\ \begin{bmatrix} (3\times 3 ;s=2 ;r=1),\ 128 \\ (1\times 1 ;s=1 ;r=1),\ 128 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 128 \end{bmatrix} \times 4 \\ \begin{bmatrix} (3\times 3 ;s=2 ;r=1),\ 128 \end{bmatrix} \times 1 \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 512 \end{bmatrix} \times 4 \\ \begin{bmatrix} (1\times 1 ;s=2 ;r=1),\ 512 \end{bmatrix} \times 1 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 128 \end{bmatrix} \times 3\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 128 \end{bmatrix} \times 4 \\ \begin{bmatrix} (3\times 3 ;s=2 ;r=1),\ 128 \end{bmatrix} \times 1 \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 512 \end{bmatrix} \times 4 \\ \begin{bmatrix} (1\times 1 ;s=2 ;r=1),\ 512 \end{bmatrix} \times 1 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 128 \end{bmatrix} \times 3\end{bmatrix}\)
\(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 23 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=2),\ 256 \end{bmatrix} \times 23 \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 1024 \end{bmatrix} \times 24\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=2 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 23 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=2),\ 256 \end{bmatrix} \times 23 \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 1024 \end{bmatrix} \times 24\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 23 \\ \begin{bmatrix} (3\times 3 ;s=2 ;r=1),\ 256 \end{bmatrix} \times 1 \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 1024 \end{bmatrix} \times 23 \\ \begin{bmatrix} (1\times 1 ;s=2 ;r=1),\ 1024 \end{bmatrix} \times 1 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 22\end{bmatrix}\)
\(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 512 \end{bmatrix} \times 3 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=4),\ 512 \end{bmatrix} \times 1 \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 2048 \end{bmatrix} \times 4 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=8),\ 512 \end{bmatrix} \times 1 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=16),\ 512 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 128 \\ (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 256 \\ (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1 \\ \begin{bmatrix} (3\times 3 ;s=2 ;r=1),\ 256 \\ (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 512 \end{bmatrix} \times 3 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=4),\ 512 \end{bmatrix} \times 1 \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 2048 \end{bmatrix} \times 4 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=8),\ 512 \end{bmatrix} \times 1 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=16),\ 512 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 512 \end{bmatrix} \times 3 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=2),\ 512 \end{bmatrix} \times 1 \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 2048 \end{bmatrix} \times 4 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=4),\ 512 \end{bmatrix} \times 1 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=8),\ 512 \end{bmatrix} \times 1\end{bmatrix}\)
  \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=2 ;r=1),\ 728 \end{bmatrix} \times 1\end{bmatrix}\)   
  \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 256 \\ (1\times 1 ;s=1 ;r=1),\ 728 \end{bmatrix} \times 1 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 728 \\ (1\times 1 ;s=1 ;r=1),\ 728 \end{bmatrix} \times 1 \\ \begin{bmatrix} (3\times 3 ;s=2 ;r=1),\ 728 \\ (1\times 1 ;s=1 ;r=1),\ 728 \end{bmatrix} \times 1\end{bmatrix}\)   
  \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 728 \\ (1\times 1 ;s=1 ;r=1),\ 728 \end{bmatrix} \times 48\end{bmatrix}\)   
  \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 1024 \end{bmatrix} \times 1\end{bmatrix}\)   
  \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 728 \\ (1\times 1 ;s=1 ;r=1),\ 728 \end{bmatrix} \times 1 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 728 \\ (1\times 1 ;s=1 ;r=1),\ 1024 \end{bmatrix} \times 1 \\ \begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 1024 \\ (1\times 1 ;s=1 ;r=1),\ 1024 \end{bmatrix} \times 1\end{bmatrix}\)   
  \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=2),\ 1024 \end{bmatrix} \times 1\end{bmatrix}\)   
  \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 1536 \end{bmatrix} \times 1\end{bmatrix}\)   
  \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=2),\ 1536 \end{bmatrix} \times 1\end{bmatrix}\)   
  \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 1536 \end{bmatrix} \times 1\end{bmatrix}\)   
  \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=2),\ 1536 \end{bmatrix} \times 1\end{bmatrix}\)   
  \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 2048 \end{bmatrix} \times 1\end{bmatrix}\)   
Classifier \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\)
\(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=12),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=6),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=12),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=6),\ 256 \end{bmatrix} \times 1\end{bmatrix}\)
\(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=24),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=12),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=24),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=12),\ 256 \end{bmatrix} \times 1\end{bmatrix}\)
\(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=36),\ 256 \end{bmatrix} \times 1 \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=18),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=36),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=18),\ 256 \end{bmatrix} \times 1\end{bmatrix}\)
\(\begin{bmatrix}\begin{bmatrix} AdaptiveAvgPool2d(1\times 1) \end{bmatrix} \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} AdaptiveAvgPool2d(1\times 1) \end{bmatrix} \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} AdaptiveAvgPool2d(1\times 1) \end{bmatrix} \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} AdaptiveAvgPool2d(1\times 1) \end{bmatrix} \\ \begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\)
\(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\)
\(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 8 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 48 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 48 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 48 \end{bmatrix} \times 1\end{bmatrix}\)
  \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\)
  \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (3\times 3 ;s=1 ;r=1),\ 256 \end{bmatrix} \times 1\end{bmatrix}\)
  \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 8 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 8 \end{bmatrix} \times 1\end{bmatrix}\) \(\begin{bmatrix}\begin{bmatrix} (1\times 1 ;s=1 ;r=1),\ 2 \end{bmatrix} \times 1\end{bmatrix}\)
  1. Square brackets represent processing blocks. The format for each processing block is \([(kernel\ size;\ stride;\ rate\ of\ dilation), output\ dimension]\)