Skip to content

Commit

Permalink
Add files via upload
Browse files Browse the repository at this point in the history
  • Loading branch information
boyuanzheng010 authored Dec 27, 2023
1 parent 0cf133a commit e2cac95
Showing 1 changed file with 196 additions and 114 deletions.
310 changes: 196 additions & 114 deletions index.html
Original file line number Diff line number Diff line change
Expand Up @@ -364,131 +364,213 @@ <h2 class="title is-3">Experiments and Results</h2>
</p>
</div>

<div class="model-labels-container">
<span class="leaderboard-label" style="background-color: rgba(249, 242, 248, 1);">Supervised Fine-Tuning</span>
<span class="leaderboard-label" style="background-color: rgba(117, 209, 215, 0.1);">In-Context Learning</span>
</div>
<!-- <div class="model-labels-container">-->
<!-- <span class="leaderboard-label" style="background-color: rgba(249, 242, 248, 1);">Supervised Fine-Tuning</span>-->
<!-- <span class="leaderboard-label" style="background-color: rgba(117, 209, 215, 0.1);">In-Context Learning</span>-->
<!-- </div>-->


<table id="table1" class="js-sort-table">
<thead>
<tr>
<th rowspan="2">Model</th>
<th colspan="3">Cross-Task</th>
<th colspan="3">Cross-Website</th>
<th colspan="3">Cross-Domain</th>
</tr>
<tr class="category-header">
<!-- Repeat this pattern for the number of categories you have -->
<td class="js-sort-number"><strong>Ele. Acc</strong></td>
<td class="js-sort-number"><strong>Op. F1</strong></td>
<td class="js-sort-number"><strong>Step SR</strong></td>
<td class="js-sort-number"><strong>Ele. Acc</strong></td>
<td class="js-sort-number"><strong>Op. F1</strong></td>
<td class="js-sort-number"><strong>Step SR</strong></td>
<td class="js-sort-number"><strong>Ele. Acc</strong></td>
<td class="js-sort-number"><strong>Op. F1</strong></td>
<td class="js-sort-number"><strong>Step SR</strong></td>
</tr>
</thead>
<tbody>
<tr>
<td>FLAN-T5 - Base</td>
<td>40.5</td>
<td>74.4</td>
<td>37.3</td>
<!-- Repeat for each data cell -->
</tr>

<tr>
<td>FLAN-T5 - Large</td>
<td>41.5</td>
<td>74.4</td>
<td>37.3</td>
<!-- Repeat for each data cell -->
</tr>

<tr>
<td>FLAN-T5 - XL</td>
<td>42.5</td>
<td>74.4</td>
<td>37.3</td>
<!-- Repeat for each data cell -->
</tr>
<!-- Repeat the <tr> block for each row of data -->
</tbody>
</table>

<!-- <table id="table1" class="js-sort-table">-->
<!-- <tr>-->
<!-- <td class="js-sort-number"><strong>Reset</strong></td>-->
<!-- <td class="js-sort-number"><strong>Overall</strong></td>-->
<!-- <td class="js-sort-number"><strong>Art & Design</strong></td>-->
<!-- <td class="js-sort-number"><strong>Business</strong></td>-->
<!-- <td class="js-sort-number"><strong>Science</strong></td>-->
<!-- <td class="js-sort-number"><strong>Health & Medicine</strong></td>-->
<!-- <td class="js-sort-number"><strong>Human. & Social Sci.</strong></td>-->
<!-- <td class="js-sort-number"><strong>Tech & Eng.</strong></td>-->
<!-- </tr>-->
<!-- &lt;!&ndash; <tr style="background-color: #f8fffe;"> &ndash;&gt;-->
<!-- <tr style="background-color: rgba(117, 209, 215, 0.1);">-->
<!-- <td style="text-align: left;">-->
<!-- <a href="https://openai.com/contributions/gpt-4v">-->
<!-- <b>GPT-4V(ision) (Playground)</b>-->
<!-- </a>-->
<!-- </td>-->
<!-- <td><b>55.7</b></td>-->
<!-- <td><b>65.3</b></td>-->
<!-- <td><b>64.3</b></td>-->
<!-- <td><b>48.4</b></td>-->
<!-- <td><b>63.5</b></td>-->
<!-- <td><b>76.3</b></td>-->
<!-- <td><b>41.7</b></td>-->
<!-- </tr>-->
<!-- &lt;!&ndash; <tr style="background-color: #f9f2f8;"> &ndash;&gt;-->
<!-- <tr style="background-color: rgba(249, 242, 248, 1);">-->
<!-- <td style="text-align: left;">-->
<!-- <a href="https://arxiv.org/abs/2311.04257">-->
<!-- <b>mPLUG-OWL2*</b>-->
<!-- </a>-->
<!-- </td>-->
<!-- &lt;!&ndash; <td style="text-align: left;"><b>mPLUG-OWL2*</b></td> &ndash;&gt;-->
<!-- <td>32.1</td>-->
<!-- <td>48.5</td>-->
<!-- <td>25.6</td>-->
<!-- <td>24.9</td>-->
<!-- <td>32.8</td>-->
<!-- <td>46.7</td>-->
<!-- <td>29.6</td>-->
<!-- </tr>-->
<!-- &lt;!&ndash; <tr style="background-color: #f9f2f8;"> &ndash;&gt;-->
<!-- <tr style="background-color: rgba(249, 242, 248, 1);">-->
<!-- <td style="text-align: left;">-->
<!-- <a href="https://arxiv.org/abs/2301.12597">-->
<!-- <b>BLIP-2 FLAN-T5-XL</b>-->
<!-- </a>-->
<!-- </td>-->
<!-- &lt;!&ndash; <td style="text-align: left;"><b>BLIP-2 FLAN-T5-XL</b></td> &ndash;&gt;-->
<!-- <td>31.0</td>-->
<!-- <td>43.0</td>-->
<!-- <td>25.6</td>-->
<!-- <td>25.1</td>-->
<!-- <td>31.8</td>-->
<!-- <td>48.0</td>-->
<!-- <td>27.8</td>-->
<!-- </tr>-->
<!-- </table>-->
<!-- <table id="table1" class="js-sort-table">-->
<!-- <thead>-->
<!-- <tr>-->
<!-- <th rowspan="2">Model</th>-->
<!-- <th colspan="3">Cross-Task</th>-->
<!-- <th colspan="3">Cross-Website</th>-->
<!-- <th colspan="3">Cross-Domain</th>-->
<!-- </tr>-->
<!-- <tr class="category-header">-->
<!-- <td class="js-sort-number"><strong>Ele. Acc</strong></td>-->
<!-- <td class="js-sort-number"><strong>Op. F1</strong></td>-->
<!-- <td class="js-sort-number"><strong>Step SR</strong></td>-->
<!-- <td class="js-sort-number"><strong>Ele. Acc</strong></td>-->
<!-- <td class="js-sort-number"><strong>Op. F1</strong></td>-->
<!-- <td class="js-sort-number"><strong>Step SR</strong></td>-->
<!-- <td class="js-sort-number"><strong>Ele. Acc</strong></td>-->
<!-- <td class="js-sort-number"><strong>Op. F1</strong></td>-->
<!-- <td class="js-sort-number"><strong>Step SR</strong></td>-->
<!-- </tr>-->
<!-- </thead>-->
<!-- <tbody>-->
<!-- <tr style="background-color: rgba(249, 242, 248, 1);">-->
<!-- <td style="text-align: left;">-->
<!-- <b>FLAN-T5-Base</b></td>-->
<!-- <td>40.5</td>-->
<!-- <td>74.4</td>-->
<!-- <td>37.3</td>-->
<!-- <td>28.7</td>-->
<!-- <td>69.6</td>-->
<!-- <td>27.9</td>-->
<!-- <td>38.2</td>-->
<!-- <td>69.1</td>-->
<!-- <td>36.2</td>-->
<!-- </tr>-->


<!-- <tr style="background-color: rgba(249, 242, 248, 1);">-->
<!-- <td style="text-align: left;">-->
<!-- <b>FLAN-T5-Large</b></td>-->
<!-- <td>52.2</td>-->
<!-- <td>70.7</td>-->
<!-- <td>48.8</td>-->
<!-- <td>35.3</td>-->
<!-- <td>65.8</td>-->
<!-- <td>32.7</td>-->
<!-- <td>41.9</td>-->
<!-- <td>64.6</td>-->
<!-- <td>39.5</td>-->
<!--</tr>-->

<!-- <tr style="background-color: rgba(249, 242, 248, 1);">-->
<!-- <td style="text-align: left;">-->
<!-- <b>FLAN-T5-XL</b></td>-->
<!-- <td>56.8</td>-->
<!-- <td>74.6</td>-->
<!-- <td>52.5</td>-->
<!-- <td>42.6</td>-->
<!-- <td>69.9</td>-->
<!-- <td>39.5</td>-->
<!-- <td>43.8</td>-->
<!-- <td>65.2</td>-->
<!-- <td>40.7</td>-->
<!-- </tr>-->


<!-- <tr style="background-color: rgba(249, 242, 248, 1);">-->
<!-- <td style="text-align: left;">-->
<!-- <b>BLIP2-T5-Base</b></td>-->
<!-- <td>39.5</td>-->
<!-- <td>74.9</td>-->
<!-- <td>36.1</td>-->
<!-- <td>34.0</td>-->
<!-- <td>70.8</td>-->
<!-- <td>32.2</td>-->
<!-- <td>38.2</td>-->
<!-- <td>72.8</td>-->
<!-- <td>37.5</td>-->
<!-- </tr>-->

<!-- <tr style="background-color: rgba(249, 242, 248, 1);">-->
<!-- <td style="text-align: left;">-->
<!-- <b>BLIP2-T5-Large</b></td>-->
<!-- <td>50.0</td>-->
<!-- <td>72.1</td>-->
<!-- <td>46.0</td>-->
<!-- <td>39.5</td>-->
<!-- <td>71.5</td>-->
<!-- <td>36.3</td>-->
<!-- <td>40.9</td>-->
<!-- <td>70.1</td>-->
<!-- <td>39.4</td>-->
<!-- </tr>-->


<!-- <tr style="background-color: rgba(249, 242, 248, 1);">-->
<!-- <td style="text-align: left;">-->
<!-- <b>BLIP2-T5-XL</b></td>-->
<!-- <td>52.9</td>-->
<!-- <td>74.9</td>-->
<!-- <td>50.3</td>-->
<!-- <td>41.7</td>-->
<!-- <td>74.1</td>-->
<!-- <td>38.3</td>-->
<!-- <td>43.8</td>-->
<!-- <td>73.4</td>-->
<!-- <td>39.6</td>-->
<!-- </tr>-->

<!-- <tr style="background-color: rgba(117, 209, 215, 0.1);">-->
<!-- <td style="text-align: left;">-->
<!-- <b>GPT-3.5</b></td>-->
<!-- <td>19.4</td>-->
<!-- <td>59.8</td>-->
<!-- <td>16.8</td>-->
<!-- <td>14.9</td>-->
<!-- <td>56.5</td>-->
<!-- <td>14.1</td>-->
<!-- <td>25.5</td>-->
<!-- <td>57.9</td>-->
<!-- <td>24.2</td>-->
<!-- </tr>-->


<!-- <tr>-->
<!-- <tr style="background-color: rgba(117, 209, 215, 0.1);">-->
<!-- <td style="text-align: left;">-->
<!-- <b>GPT-4</b></td> <td>40.2</td>-->
<!-- <td>63.4</td>-->
<!-- <td>31.7</td>-->
<!-- <td>27.4</td>-->
<!-- <td>61.0</td>-->
<!-- <td>27.0</td>-->
<!-- <td>36.2</td>-->
<!-- <td>61.9</td>-->
<!-- <td>29.7</td>-->
<!-- </tr>-->

<!-- <tr style="background-color: rgba(117, 209, 215, 0.1);">-->
<!-- <td style="text-align: left;">-->
<!-- <b>SEEACT-Attributes</b></td>-->
<!-- <td>4.7</td>-->
<!-- <td>39.5</td>-->
<!-- <td>4.7</td>-->
<!-- <td>9.7</td>-->
<!-- <td>37.8</td>-->
<!-- <td>9.7</td>-->
<!-- <td>16.0</td>-->
<!-- <td>41.4</td>-->
<!-- <td>15.3</td>-->
<!-- </tr>-->


<!-- <tr style="background-color: rgba(117, 209, 215, 0.1);">-->
<!-- <td style="text-align: left;">-->
<!-- <b>SEEACT-Annotation</b></td>-->
<!-- <td>15.1</td>-->
<!-- <td>66.5</td>-->
<!-- <td>13.0</td>-->
<!-- <td>11.3</td>-->
<!-- <td>63.4</td>-->
<!-- <td>10.5</td>-->
<!-- <td>16.5</td>-->
<!-- <td>65.1</td>-->
<!-- <td>14.7</td>-->
<!-- </tr>-->

<!-- <tr style="background-color: rgba(117, 209, 215, 0.1);">-->
<!-- <td style="text-align: left;">-->
<!-- <b>SEEACT-Choice</b></td>-->
<!-- <td>48.9</td>-->
<!-- <td>69.1</td>-->
<!-- <td>40.6</td>-->
<!-- <td>48.5</td>-->
<!-- <td>70.6</td>-->
<!-- <td>41.7</td>-->
<!-- <td>44.0</td>-->
<!-- <td>70.9</td>-->
<!-- <td>40.9</td>-->
<!-- </tr>-->

<!-- <tr style="background-color: rgba(117, 209, 215, 0.1);">-->
<!-- <td style="text-align: left;">-->
<!-- <b>SEEACT-Oracle</b></td>-->
<!-- <td>72.9</td>-->
<!-- <td>80.9</td>-->
<!-- <td>65.7</td>-->
<!-- <td>74.4</td>-->
<!-- <td>83.7</td>-->
<!-- <td>70.0</td>-->
<!-- <td>72.8</td>-->
<!-- <td>73.6</td>-->
<!-- <td>62.1</td>-->
<!-- </tr>-->

<!-- </tbody>-->
<!--</table>-->
</div>
</div>
</div>
</div>



</div>
</section>

Expand Down

0 comments on commit e2cac95

Please sign in to comment.