Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Add Arabic Docs to Datasets #7094

Open
wants to merge 223 commits into
base: main
Choose a base branch
from
Open
Show file tree
Hide file tree
Changes from all commits
Commits
Show all changes
223 commits
Select commit Hold shift + click to select a range
f621ebe
إضافة docs/source/ar/about_arrow.md
AhmedAlmaghz Aug 7, 2024
6d6e3fe
إضافة docs/source/ar/faiss_es.mdx
AhmedAlmaghz Aug 7, 2024
ce7209e
إضافة docs/source/ar/about_dataset_load.mdx
AhmedAlmaghz Aug 7, 2024
7966d49
إضافة docs/source/ar/about_cache.mdx
AhmedAlmaghz Aug 7, 2024
420a44c
إضافة docs/source/ar/dataset_card.mdx
AhmedAlmaghz Aug 7, 2024
39b0743
إضافة docs/source/ar/access.mdx
AhmedAlmaghz Aug 7, 2024
b5177e0
إضافة docs/source/ar/about_dataset_features.mdx
AhmedAlmaghz Aug 7, 2024
bd1c6f5
إضافة docs/source/ar/depth_estimation.mdx
AhmedAlmaghz Aug 7, 2024
6bbc54c
إضافة docs/source/ar/filesystems.mdx
AhmedAlmaghz Aug 7, 2024
97b503e
إضافة docs/source/ar/audio_load.mdx
AhmedAlmaghz Aug 7, 2024
c521a09
إضافة docs/source/ar/audio_process.mdx
AhmedAlmaghz Aug 7, 2024
f9bbcdb
إضافة docs/source/ar/create_dataset.mdx
AhmedAlmaghz Aug 7, 2024
4ce5b21
إضافة docs/source/ar/cache.mdx
AhmedAlmaghz Aug 7, 2024
e3e4ddd
إضافة docs/source/ar/cli.mdx
AhmedAlmaghz Aug 7, 2024
1562a06
إضافة docs/source/ar/dataset_script.mdx
AhmedAlmaghz Aug 7, 2024
cd15a77
إضافة docs/source/ar/about_map_batch.mdx
AhmedAlmaghz Aug 7, 2024
bd0635a
إضافة docs/source/ar/about_mapstyle_vs_iterable.mdx
AhmedAlmaghz Aug 7, 2024
8bb7101
إضافة docs/source/ar/audio_dataset.mdx
AhmedAlmaghz Aug 7, 2024
38bbb29
إضافة docs/source/ar/how_to.md
AhmedAlmaghz Aug 7, 2024
1e1171f
إضافة docs/source/ar/image_classification.mdx
AhmedAlmaghz Aug 7, 2024
c4f6081
إضافة docs/source/ar/image_dataset.mdx
AhmedAlmaghz Aug 7, 2024
dac3df1
إضافة docs/source/ar/image_load.mdx
AhmedAlmaghz Aug 7, 2024
30a4ec7
إضافة docs/source/ar/index.mdx
AhmedAlmaghz Aug 7, 2024
72dd0bc
إضافة docs/source/ar/load_hub.mdx
AhmedAlmaghz Aug 7, 2024
d58aed1
إضافة docs/source/ar/nlp_load.mdx
AhmedAlmaghz Aug 7, 2024
f28b2f0
إضافة docs/source/ar/image_process.mdx
AhmedAlmaghz Aug 7, 2024
e857855
إضافة docs/source/ar/nlp_process.mdx
AhmedAlmaghz Aug 7, 2024
c8d678b
إضافة docs/source/ar/installation.md
AhmedAlmaghz Aug 7, 2024
a295457
إضافة docs/source/ar/object_detection.mdx
AhmedAlmaghz Aug 7, 2024
a584585
إضافة docs/source/ar/loading.mdx
AhmedAlmaghz Aug 7, 2024
811cc0c
إضافة docs/source/ar/_redirects.yml
AhmedAlmaghz Aug 7, 2024
9a3de49
إضافة docs/source/ar/process.mdx
AhmedAlmaghz Aug 7, 2024
4d23f9f
إضافة docs/source/ar/tutorial.md
AhmedAlmaghz Aug 7, 2024
dae118e
إضافة docs/source/ar/use_with_jax.mdx
AhmedAlmaghz Aug 7, 2024
63303dd
إضافة docs/source/ar/_toctree.yml
AhmedAlmaghz Aug 7, 2024
f170bf8
إضافة docs/source/ar/repository_structure.mdx
AhmedAlmaghz Aug 7, 2024
d1c1d20
إضافة docs/source/ar/troubleshoot.mdx
AhmedAlmaghz Aug 7, 2024
0188032
إضافة docs/source/ar/use_with_pytorch.mdx
AhmedAlmaghz Aug 7, 2024
4ecbb0d
إضافة docs/source/ar/use_with_tensorflow.mdx
AhmedAlmaghz Aug 7, 2024
fa70dd2
إضافة docs/source/ar/semantic_segmentation.mdx
AhmedAlmaghz Aug 7, 2024
ffa3da9
إضافة docs/source/ar/tabular_load.mdx
AhmedAlmaghz Aug 7, 2024
1f20fe0
إضافة docs/source/ar/use_dataset.mdx
AhmedAlmaghz Aug 7, 2024
6a80fa3
إضافة docs/source/ar/share.mdx
AhmedAlmaghz Aug 7, 2024
c134e30
إضافة docs/source/ar/upload_dataset.mdx
AhmedAlmaghz Aug 7, 2024
7dad271
إضافة docs/source/ar/use_with_spark.mdx
AhmedAlmaghz Aug 7, 2024
97e47ac
إضافة docs/source/ar/quickstart.mdx
AhmedAlmaghz Aug 7, 2024
684ff7f
إضافة docs/source/ar/stream.mdx
AhmedAlmaghz Aug 7, 2024
c1f89b4
إضافة docs/source/ar/package_reference/task_templates.mdx
AhmedAlmaghz Aug 7, 2024
dce4013
إضافة docs/source/ar/package_reference/main_classes.mdx
AhmedAlmaghz Aug 7, 2024
09ea319
إضافة docs/source/ar/package_reference/loading_methods.mdx
AhmedAlmaghz Aug 7, 2024
f35b650
إضافة docs/source/ar/package_reference/builder_classes.mdx
AhmedAlmaghz Aug 7, 2024
4d5e40a
إضافة docs/source/ar/package_reference/utilities.mdx
AhmedAlmaghz Aug 7, 2024
4d28850
إضافة docs/source/ar/package_reference/table_classes.mdx
AhmedAlmaghz Aug 7, 2024
ebb89b2
إضافة docs/source/ar/imgs/course_banner.png
AhmedAlmaghz Aug 7, 2024
af83d6c
إضافة docs/source/ar/imgs/datasets_logo_name.jpg
AhmedAlmaghz Aug 7, 2024
eed5a6b
إضافة docs/source/en/_config.py
AhmedAlmaghz Aug 7, 2024
e8072cb
إضافة docs/source/en/_redirects.yml
AhmedAlmaghz Aug 7, 2024
21f605d
إضافة docs/source/en/_toctree.yml
AhmedAlmaghz Aug 7, 2024
ca50d57
إضافة docs/source/en/about_arrow.md
AhmedAlmaghz Aug 7, 2024
565b823
إضافة docs/source/en/about_cache.mdx
AhmedAlmaghz Aug 7, 2024
645190b
إضافة docs/source/en/about_dataset_features.mdx
AhmedAlmaghz Aug 7, 2024
f80b26d
إضافة docs/source/en/about_dataset_load.mdx
AhmedAlmaghz Aug 7, 2024
9a5f359
إضافة docs/source/en/about_map_batch.mdx
AhmedAlmaghz Aug 7, 2024
427dab5
إضافة docs/source/en/about_mapstyle_vs_iterable.mdx
AhmedAlmaghz Aug 7, 2024
2d77b3b
إضافة docs/source/en/access.mdx
AhmedAlmaghz Aug 7, 2024
3f196bf
إضافة docs/source/en/audio_dataset.mdx
AhmedAlmaghz Aug 7, 2024
3ccb532
إضافة docs/source/en/audio_load.mdx
AhmedAlmaghz Aug 7, 2024
f609026
إضافة docs/source/en/audio_process.mdx
AhmedAlmaghz Aug 7, 2024
be22d68
إضافة docs/source/en/cache.mdx
AhmedAlmaghz Aug 7, 2024
991d1be
إضافة docs/source/en/cli.mdx
AhmedAlmaghz Aug 7, 2024
d48a44d
إضافة docs/source/en/create_dataset.mdx
AhmedAlmaghz Aug 7, 2024
48c425f
إضافة docs/source/en/dataset_card.mdx
AhmedAlmaghz Aug 7, 2024
e0af9a7
إضافة docs/source/en/dataset_script.mdx
AhmedAlmaghz Aug 7, 2024
1178429
إضافة docs/source/en/depth_estimation.mdx
AhmedAlmaghz Aug 7, 2024
2183af1
إضافة docs/source/en/faiss_es.mdx
AhmedAlmaghz Aug 7, 2024
d75e908
إضافة docs/source/en/filesystems.mdx
AhmedAlmaghz Aug 7, 2024
5bb1d54
إضافة docs/source/en/how_to.md
AhmedAlmaghz Aug 7, 2024
38c44f9
إضافة docs/source/en/image_classification.mdx
AhmedAlmaghz Aug 7, 2024
2f45c64
إضافة docs/source/en/image_dataset.mdx
AhmedAlmaghz Aug 7, 2024
454fa9a
إضافة docs/source/en/image_load.mdx
AhmedAlmaghz Aug 7, 2024
76f78a2
إضافة docs/source/en/image_process.mdx
AhmedAlmaghz Aug 7, 2024
388135f
إضافة docs/source/en/index.mdx
AhmedAlmaghz Aug 7, 2024
bd0e3b9
إضافة docs/source/en/installation.md
AhmedAlmaghz Aug 7, 2024
85fb6dc
إضافة docs/source/en/load_hub.mdx
AhmedAlmaghz Aug 7, 2024
96e4d13
إضافة docs/source/en/loading.mdx
AhmedAlmaghz Aug 7, 2024
3bb9ad8
إضافة docs/source/en/nlp_load.mdx
AhmedAlmaghz Aug 7, 2024
2ad4ab4
إضافة docs/source/en/nlp_process.mdx
AhmedAlmaghz Aug 7, 2024
9025a50
إضافة docs/source/en/object_detection.mdx
AhmedAlmaghz Aug 7, 2024
9618754
إضافة docs/source/en/process.mdx
AhmedAlmaghz Aug 7, 2024
d5e1c02
إضافة docs/source/en/quickstart.mdx
AhmedAlmaghz Aug 7, 2024
e077482
إضافة docs/source/en/repository_structure.mdx
AhmedAlmaghz Aug 7, 2024
9fb9723
إضافة docs/source/en/semantic_segmentation.mdx
AhmedAlmaghz Aug 7, 2024
e213327
إضافة docs/source/en/share.mdx
AhmedAlmaghz Aug 7, 2024
3d27197
إضافة docs/source/en/stream.mdx
AhmedAlmaghz Aug 7, 2024
f9835c1
إضافة docs/source/en/tabular_load.mdx
AhmedAlmaghz Aug 7, 2024
dc95485
إضافة docs/source/en/troubleshoot.mdx
AhmedAlmaghz Aug 7, 2024
1505207
إضافة docs/source/en/tutorial.md
AhmedAlmaghz Aug 7, 2024
6a60b80
إضافة docs/source/en/upload_dataset.mdx
AhmedAlmaghz Aug 7, 2024
765bd47
إضافة docs/source/en/use_dataset.mdx
AhmedAlmaghz Aug 7, 2024
9b01379
إضافة docs/source/en/use_with_jax.mdx
AhmedAlmaghz Aug 7, 2024
e3edfa9
إضافة docs/source/en/use_with_pytorch.mdx
AhmedAlmaghz Aug 7, 2024
26b6b8c
إضافة docs/source/en/use_with_spark.mdx
AhmedAlmaghz Aug 7, 2024
ce5b3d5
إضافة docs/source/en/use_with_tensorflow.mdx
AhmedAlmaghz Aug 7, 2024
1f27331
إضافة docs/source/en/imgs/course_banner.png
AhmedAlmaghz Aug 7, 2024
7ce1996
إضافة docs/source/en/imgs/datasets_logo_name.jpg
AhmedAlmaghz Aug 7, 2024
d69f5ef
إضافة docs/source/en/package_reference/builder_classes.mdx
AhmedAlmaghz Aug 7, 2024
1875848
إضافة docs/source/en/package_reference/loading_methods.mdx
AhmedAlmaghz Aug 7, 2024
85aa0f3
إضافة docs/source/en/package_reference/main_classes.mdx
AhmedAlmaghz Aug 7, 2024
33d5111
إضافة docs/source/en/package_reference/table_classes.mdx
AhmedAlmaghz Aug 7, 2024
a706560
إضافة docs/source/en/package_reference/task_templates.mdx
AhmedAlmaghz Aug 7, 2024
6356ea0
إضافة docs/source/en/package_reference/utilities.mdx
AhmedAlmaghz Aug 7, 2024
47312af
Delete docs/source directory
AhmedAlmaghz Aug 7, 2024
fb8a93a
إضافة docs/source/ar/about_arrow.md
AhmedAlmaghz Aug 7, 2024
7fccc38
إضافة docs/source/ar/faiss_es.mdx
AhmedAlmaghz Aug 7, 2024
444da68
إضافة docs/source/ar/about_dataset_load.mdx
AhmedAlmaghz Aug 7, 2024
7434b2d
إضافة docs/source/ar/about_cache.mdx
AhmedAlmaghz Aug 7, 2024
fc7b523
إضافة docs/source/ar/dataset_card.mdx
AhmedAlmaghz Aug 7, 2024
767dd65
إضافة docs/source/ar/access.mdx
AhmedAlmaghz Aug 7, 2024
5bfd41d
إضافة docs/source/ar/about_dataset_features.mdx
AhmedAlmaghz Aug 7, 2024
1eae118
إضافة docs/source/ar/depth_estimation.mdx
AhmedAlmaghz Aug 7, 2024
98faf4a
إضافة docs/source/ar/filesystems.mdx
AhmedAlmaghz Aug 7, 2024
3431cef
إضافة docs/source/ar/audio_load.mdx
AhmedAlmaghz Aug 7, 2024
07cd0bc
إضافة docs/source/ar/audio_process.mdx
AhmedAlmaghz Aug 7, 2024
bf81792
إضافة docs/source/ar/create_dataset.mdx
AhmedAlmaghz Aug 7, 2024
29e631e
إضافة docs/source/ar/cache.mdx
AhmedAlmaghz Aug 7, 2024
8a67335
إضافة docs/source/ar/cli.mdx
AhmedAlmaghz Aug 7, 2024
3336e89
إضافة docs/source/ar/dataset_script.mdx
AhmedAlmaghz Aug 7, 2024
1f5c06b
إضافة docs/source/ar/about_map_batch.mdx
AhmedAlmaghz Aug 7, 2024
bd3d8a3
إضافة docs/source/ar/about_mapstyle_vs_iterable.mdx
AhmedAlmaghz Aug 7, 2024
be2f717
إضافة docs/source/ar/audio_dataset.mdx
AhmedAlmaghz Aug 7, 2024
f13698f
إضافة docs/source/ar/how_to.md
AhmedAlmaghz Aug 7, 2024
4dafa77
إضافة docs/source/ar/image_classification.mdx
AhmedAlmaghz Aug 7, 2024
851df06
إضافة docs/source/ar/image_dataset.mdx
AhmedAlmaghz Aug 7, 2024
fd7f502
إضافة docs/source/ar/image_load.mdx
AhmedAlmaghz Aug 7, 2024
391638b
إضافة docs/source/ar/index.mdx
AhmedAlmaghz Aug 7, 2024
308e652
إضافة docs/source/ar/load_hub.mdx
AhmedAlmaghz Aug 7, 2024
5069fc1
إضافة docs/source/ar/nlp_load.mdx
AhmedAlmaghz Aug 7, 2024
05f39c5
إضافة docs/source/ar/image_process.mdx
AhmedAlmaghz Aug 7, 2024
0939865
إضافة docs/source/ar/nlp_process.mdx
AhmedAlmaghz Aug 7, 2024
87aef08
إضافة docs/source/ar/installation.md
AhmedAlmaghz Aug 7, 2024
445e189
إضافة docs/source/ar/object_detection.mdx
AhmedAlmaghz Aug 7, 2024
4477960
إضافة docs/source/ar/loading.mdx
AhmedAlmaghz Aug 7, 2024
c70c12d
إضافة docs/source/ar/_redirects.yml
AhmedAlmaghz Aug 7, 2024
d8834c2
إضافة docs/source/ar/process.mdx
AhmedAlmaghz Aug 7, 2024
64f8485
إضافة docs/source/ar/tutorial.md
AhmedAlmaghz Aug 7, 2024
2efb5fb
إضافة docs/source/ar/use_with_jax.mdx
AhmedAlmaghz Aug 7, 2024
4276a6d
إضافة docs/source/ar/_toctree.yml
AhmedAlmaghz Aug 7, 2024
09560c6
إضافة docs/source/ar/repository_structure.mdx
AhmedAlmaghz Aug 7, 2024
f9601b8
إضافة docs/source/ar/troubleshoot.mdx
AhmedAlmaghz Aug 7, 2024
e428945
إضافة docs/source/ar/use_with_pytorch.mdx
AhmedAlmaghz Aug 7, 2024
661f818
إضافة docs/source/ar/use_with_tensorflow.mdx
AhmedAlmaghz Aug 7, 2024
76b6701
إضافة docs/source/ar/semantic_segmentation.mdx
AhmedAlmaghz Aug 7, 2024
85f9709
إضافة docs/source/ar/tabular_load.mdx
AhmedAlmaghz Aug 7, 2024
c6491db
إضافة docs/source/ar/use_dataset.mdx
AhmedAlmaghz Aug 7, 2024
2e77141
إضافة docs/source/ar/share.mdx
AhmedAlmaghz Aug 7, 2024
43ea8aa
إضافة docs/source/ar/upload_dataset.mdx
AhmedAlmaghz Aug 7, 2024
82db0ff
إضافة docs/source/ar/use_with_spark.mdx
AhmedAlmaghz Aug 7, 2024
ad3828c
إضافة docs/source/ar/quickstart.mdx
AhmedAlmaghz Aug 7, 2024
277d6e6
إضافة docs/source/ar/stream.mdx
AhmedAlmaghz Aug 7, 2024
788dd36
إضافة docs/source/ar/package_reference/task_templates.mdx
AhmedAlmaghz Aug 7, 2024
767276d
إضافة docs/source/ar/package_reference/main_classes.mdx
AhmedAlmaghz Aug 7, 2024
53e7172
إضافة docs/source/ar/package_reference/loading_methods.mdx
AhmedAlmaghz Aug 7, 2024
5339dd7
إضافة docs/source/ar/package_reference/builder_classes.mdx
AhmedAlmaghz Aug 7, 2024
8bfdf39
إضافة docs/source/ar/package_reference/utilities.mdx
AhmedAlmaghz Aug 7, 2024
6f59075
إضافة docs/source/ar/package_reference/table_classes.mdx
AhmedAlmaghz Aug 7, 2024
f559ea2
إضافة docs/source/ar/imgs/course_banner.png
AhmedAlmaghz Aug 7, 2024
6b4a136
إضافة docs/source/ar/imgs/datasets_logo_name.jpg
AhmedAlmaghz Aug 7, 2024
993c8af
إضافة docs/source/en/_config.py
AhmedAlmaghz Aug 7, 2024
1d805b4
إضافة docs/source/en/_redirects.yml
AhmedAlmaghz Aug 7, 2024
27a19a4
إضافة docs/source/en/_toctree.yml
AhmedAlmaghz Aug 7, 2024
443217f
إضافة docs/source/en/about_arrow.md
AhmedAlmaghz Aug 7, 2024
4733df5
إضافة docs/source/en/about_cache.mdx
AhmedAlmaghz Aug 7, 2024
4c3a591
إضافة docs/source/en/about_dataset_features.mdx
AhmedAlmaghz Aug 7, 2024
c77a2fc
إضافة docs/source/en/about_dataset_load.mdx
AhmedAlmaghz Aug 7, 2024
fdc4972
إضافة docs/source/en/about_map_batch.mdx
AhmedAlmaghz Aug 7, 2024
f141c12
إضافة docs/source/en/about_mapstyle_vs_iterable.mdx
AhmedAlmaghz Aug 7, 2024
4a5a42c
إضافة docs/source/en/access.mdx
AhmedAlmaghz Aug 7, 2024
6c7e592
إضافة docs/source/en/audio_dataset.mdx
AhmedAlmaghz Aug 7, 2024
73d9eb9
إضافة docs/source/en/audio_load.mdx
AhmedAlmaghz Aug 7, 2024
2ea9647
إضافة docs/source/en/audio_process.mdx
AhmedAlmaghz Aug 7, 2024
091f1c4
إضافة docs/source/en/cache.mdx
AhmedAlmaghz Aug 7, 2024
ced09fb
إضافة docs/source/en/cli.mdx
AhmedAlmaghz Aug 7, 2024
649c4b2
إضافة docs/source/en/create_dataset.mdx
AhmedAlmaghz Aug 7, 2024
d49dc77
إضافة docs/source/en/dataset_card.mdx
AhmedAlmaghz Aug 7, 2024
6e936c2
إضافة docs/source/en/dataset_script.mdx
AhmedAlmaghz Aug 7, 2024
77ab888
إضافة docs/source/en/depth_estimation.mdx
AhmedAlmaghz Aug 7, 2024
e7df774
إضافة docs/source/en/faiss_es.mdx
AhmedAlmaghz Aug 7, 2024
cb02978
إضافة docs/source/en/filesystems.mdx
AhmedAlmaghz Aug 7, 2024
ac539fd
إضافة docs/source/en/how_to.md
AhmedAlmaghz Aug 7, 2024
ad6a019
إضافة docs/source/en/image_classification.mdx
AhmedAlmaghz Aug 7, 2024
9138f39
إضافة docs/source/en/image_dataset.mdx
AhmedAlmaghz Aug 7, 2024
979dc7f
إضافة docs/source/en/image_load.mdx
AhmedAlmaghz Aug 7, 2024
083fe9d
إضافة docs/source/en/image_process.mdx
AhmedAlmaghz Aug 7, 2024
b0c3314
إضافة docs/source/en/index.mdx
AhmedAlmaghz Aug 7, 2024
03375dc
إضافة docs/source/en/installation.md
AhmedAlmaghz Aug 7, 2024
89c9e71
إضافة docs/source/en/load_hub.mdx
AhmedAlmaghz Aug 7, 2024
c2031a8
إضافة docs/source/en/loading.mdx
AhmedAlmaghz Aug 7, 2024
fa816af
إضافة docs/source/en/nlp_load.mdx
AhmedAlmaghz Aug 7, 2024
08a096e
إضافة docs/source/en/nlp_process.mdx
AhmedAlmaghz Aug 7, 2024
2cbf1a5
إضافة docs/source/en/object_detection.mdx
AhmedAlmaghz Aug 7, 2024
4d8b85c
إضافة docs/source/en/process.mdx
AhmedAlmaghz Aug 7, 2024
cd2a95d
إضافة docs/source/en/quickstart.mdx
AhmedAlmaghz Aug 7, 2024
21a65a7
إضافة docs/source/en/repository_structure.mdx
AhmedAlmaghz Aug 7, 2024
6fea31c
إضافة docs/source/en/semantic_segmentation.mdx
AhmedAlmaghz Aug 7, 2024
20f4506
إضافة docs/source/en/share.mdx
AhmedAlmaghz Aug 7, 2024
6e893ea
إضافة docs/source/en/stream.mdx
AhmedAlmaghz Aug 7, 2024
1fb8dac
إضافة docs/source/en/tabular_load.mdx
AhmedAlmaghz Aug 7, 2024
71d40c8
إضافة docs/source/en/troubleshoot.mdx
AhmedAlmaghz Aug 7, 2024
aade18f
إضافة docs/source/en/tutorial.md
AhmedAlmaghz Aug 7, 2024
8069213
إضافة docs/source/en/upload_dataset.mdx
AhmedAlmaghz Aug 7, 2024
cf610c2
إضافة docs/source/en/use_dataset.mdx
AhmedAlmaghz Aug 7, 2024
165d11b
إضافة docs/source/en/use_with_jax.mdx
AhmedAlmaghz Aug 7, 2024
79965dc
إضافة docs/source/en/use_with_pytorch.mdx
AhmedAlmaghz Aug 7, 2024
68f9811
إضافة docs/source/en/use_with_spark.mdx
AhmedAlmaghz Aug 7, 2024
26151fb
إضافة docs/source/en/use_with_tensorflow.mdx
AhmedAlmaghz Aug 7, 2024
4a925c6
إضافة docs/source/en/imgs/course_banner.png
AhmedAlmaghz Aug 7, 2024
5639fdd
إضافة docs/source/en/imgs/datasets_logo_name.jpg
AhmedAlmaghz Aug 7, 2024
b10cea9
إضافة docs/source/en/package_reference/builder_classes.mdx
AhmedAlmaghz Aug 7, 2024
51808c6
إضافة docs/source/en/package_reference/loading_methods.mdx
AhmedAlmaghz Aug 7, 2024
e155770
إضافة docs/source/en/package_reference/main_classes.mdx
AhmedAlmaghz Aug 7, 2024
2ab7b9d
إضافة docs/source/en/package_reference/table_classes.mdx
AhmedAlmaghz Aug 7, 2024
accc608
إضافة docs/source/en/package_reference/task_templates.mdx
AhmedAlmaghz Aug 7, 2024
d20feda
إضافة docs/source/en/package_reference/utilities.mdx
AhmedAlmaghz Aug 7, 2024
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
File renamed without changes.
124 changes: 124 additions & 0 deletions docs/source/ar/_toctree.yml
Original file line number Diff line number Diff line change
@@ -0,0 +1,124 @@
- sections:
- local: index
title: 🤗 مجموعات البيانات
- local: quickstart
title: دليل سريع
- local: installation
title: التثبيت
title: البدء
- sections:
- local: tutorial
title: نظرة عامة
- local: load_hub
title: تحميل مجموعة بيانات من المركز
- local: access
title: تعرف على مجموعة البيانات الخاصة بك
- local: use_dataset
title: معالجة مسبقة
- local: create_dataset
title: إنشاء مجموعة بيانات
- local: upload_dataset
title: مشاركة مجموعة بيانات في المركز
title: "البرامج التعليمية"
- sections:
- local: how_to
title: نظرة عامة
- sections:
- local: loading
title: تحميل
- local: process
title: معالجة
- local: stream
title: تدفق
- local: use_with_tensorflow
title: استخدام مع TensorFlow
- local: use_with_pytorch
title: استخدام مع PyTorch
- local: use_with_jax
title: استخدام مع جاكس
- local: use_with_spark
title: استخدام مع شرارة
- local: cache
title: إدارة ذاكرة التخزين المؤقت
- local: filesystems
title: التخزين السحابي
- local: faiss_es
title: فهرس البحث
- local: cli
title: واجهة سطر الأوامر
- local: troubleshoot
title: استكشاف الأخطاء وإصلاحها
title: "الاستخدام العام"
- sections:
- local: audio_load
title: تحميل بيانات صوتية
- local: audio_process
title: معالجة البيانات الصوتية
- local: audio_dataset
title: إنشاء مجموعة بيانات صوتية
title: "صوتي"
- sections:
- local: image_load
title: تحميل بيانات الصورة
- local: image_process
title: معالجة بيانات الصورة
- local: image_dataset
title: إنشاء مجموعة بيانات الصور
- local: depth_estimation
title: تقدير العمق
- local: image_classification
title: تصنيف الصور
- local: semantic_segmentation
title: تجزئة الصورة الدلالية
- local: object_detection
title: اكتشاف الأشياء
title: "الرؤية"
- sections:
- local: nlp_load
title: تحميل بيانات النص
- local: nlp_process
title: معالجة بيانات النص
title: "نص"
- sections:
- local: tabular_load
title: تحميل البيانات الجدولية
title: "جدولي"
- sections:
- local: share
title: حصة
- local: dataset_card
title: إنشاء بطاقة مجموعة بيانات
- local: repository_structure
title: هيكل مستودعك
- local: dataset_script
title: إنشاء نص تحميل مجموعة بيانات
title: "مستودع مجموعة البيانات"
title: "أدلة كيفية الاستخدام"
- sections:
- local: about_arrow
title: مجموعات البيانات 🤝 السهم
- local: about_cache
title: ذاكرة التخزين المؤقت
- local: about_mapstyle_vs_iterable
title: مجموعة البيانات أو IterableDataset
- local: about_dataset_features
title: ميزات مجموعة البيانات
- local: about_dataset_load
title: إنشاء وتحميل
- local: about_map_batch
title: تعيين التخصيص
title: "أدلة مفاهيمية"
- sections:
- local: package_reference/main_classes
title: الفئات الرئيسية
- local: package_reference/builder_classes
title: فئات الباني
- local: package_reference/loading_methods
title: أساليب التحميل
- local: package_reference/table_classes
title: فئات الجدول
- local: package_reference/utilities
title: المرافق
- local: package_reference/task_templates
title: قوالب المهام
title: "مرجع"
48 changes: 48 additions & 0 deletions docs/source/ar/about_arrow.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,48 @@
# Datasets 🤝 Arrow

## ما هو Arrow؟

[Arrow](https://arrow.apache.org/) يتيح معالجة ونقل كميات كبيرة من البيانات بسرعة. إنه تنسيق بيانات محدد يخزن البيانات في تخطيط ذاكرة عمودي. يوفر هذا العديد من المزايا الهامة:

* التنسيق القياسي لـ Arrow يسمح [بالقراءة بدون نسخ](https://en.wikipedia.org/wiki/Zero-copy) والتي تزيل فعليًا جميع النفقات العامة للتسلسل.
* Arrow لا يعتمد على لغة برمجة معينة، لذلك فهو يدعم لغات برمجة مختلفة.
* Arrow موجه نحو الأعمدة، لذلك فهو أسرع في الاستعلام ومعالجة شرائح أو أعمدة من البيانات.
* يسمح Arrow بالتسليم بدون نسخ إلى أدوات التعلم الآلي القياسية مثل NumPy وPandas وPyTorch وTensorFlow.
* يدعم Arrow العديد من أنواع الأعمدة، والتي قد تكون متداخلة.

## الذاكرة الخرائطية

🤗 يستخدم Datasets Arrow لنظام التخزين المؤقت المحلي الخاص به. يسمح ذلك بدعم مجموعات البيانات بواسطة ذاكرة تخزين مؤقت على القرص، يتم تعيينها إلى الذاكرة للبحث السريع. تسمح هذه البنية باستخدام مجموعات بيانات كبيرة على أجهزة ذات ذاكرة جهاز صغيرة نسبيًا.

على سبيل المثال، لا يستغرق تحميل مجموعة بيانات Wikipedia الإنجليزية الكاملة سوى بضعة ميغابايت من ذاكرة الوصول العشوائي (RAM):

```python
>>> import os; import psutil; import timeit
>>> from datasets import load_dataset

# Process.memory_info is expressed in bytes, so convert to megabytes
>>> mem_before = psutil.Process(os.getpid()).memory_info().rss / (1024 * 1024)
>>> wiki = load_dataset("wikipedia", "20220301.en", split="train")
>>> mem_after = psutil.Process(os.getpid()).memory_info().rss / (1024 * 1024)

>>> print(f"RAM memory used: {(mem_after - mem_before)} MB")
RAM memory used: 50 MB
```

هذا ممكن لأن بيانات Arrow يتم تعيينها إلى الذاكرة فعليًا من القرص، وليس تحميلها في الذاكرة. تسمح الخرائط الذاكرية بالوصول إلى البيانات على القرص، وتستفيد من قدرات الذاكرة الظاهرية للبحث السريع.

## الأداء

إن التكرار فوق مجموعة بيانات ذات خريطة ذاكرة باستخدام Arrow سريع. إن التكرار فوق Wikipedia على جهاز كمبيوتر محمول يمنحك سرعات تتراوح بين 1-3 جيجابت/ثانية:

```python
>>> s = """batch_size = 1000
... for batch in wiki.iter(batch_size):
... ...
... """

>>> elapsed_time = timeit.timeit(stmt=s, number=1, globals=globals())
>>> print(f"Time to iterate over the {wiki.dataset_size >> 30} GB dataset: {elapsed_time:.1f} sec, "
... f"ie. {float(wiki.dataset_size >> 27)/elapsed_time:.1f} Gb/s")
Time to iterate over the 18 GB dataset: 31.8 sec, ie. 4.8 Gb/s
```
58 changes: 58 additions & 0 deletions docs/source/ar/about_cache.mdx
Original file line number Diff line number Diff line change
@@ -0,0 +1,58 @@
# ذاكرة التخزين المؤقت

ذاكرة التخزين المؤقت هي أحد الأسباب التي تجعل 🤗 Datasets فعالًا للغاية. فهو يخزن مجموعات البيانات التي تم تنزيلها ومعالجتها مسبقًا، بحيث يتم إعادة تحميلها مباشرة من ذاكرة التخزين المؤقت عند الحاجة إلى استخدامها مرة أخرى. وهذا يجنبك الاضطرار إلى تنزيل مجموعة بيانات مرة أخرى، أو إعادة تطبيق وظائف المعالجة. حتى بعد إغلاق جلسة Python وبدء أخرى جديدة، سيقوم 🤗 Datasets بإعادة تحميل مجموعة البيانات الخاصة بك مباشرة من ذاكرة التخزين المؤقت!

## البصمة

كيف تتابع ذاكرة التخزين المؤقت التحويلات التي يتم تطبيقها على مجموعة بيانات؟ حسنًا، يقوم 🤗 Datasets بتعيين بصمة لملف ذاكرة التخزين المؤقت. تقوم البصمة بتتبع الحالة الحالية لمجموعة البيانات. يتم حساب البصمة الأولية باستخدام تجزئة من جدول Arrow، أو تجزئة من ملفات Arrow إذا كانت مجموعة البيانات على القرص. يتم حساب البصمات اللاحقة عن طريق دمج بصمة الحالة السابقة، وتجزئة أحدث تحويل تم تطبيقه.

<Tip>

التحويلات هي أي من طرق المعالجة من أدلة [كيفية المعالجة](./process) مثل [`Dataset.map`] أو [`Dataset.shuffle`].

</Tip>

هذا ما تبدو عليه البصمات الفعلية:

```py
>>> from datasets import Dataset
>>> dataset1 = Dataset.from_dict({"a": [0, 1, 2]})
>>> dataset2 = dataset1.map(lambda x: {"a": x["a"] + 1})
>>> print(dataset1._fingerprint, dataset2._fingerprint)
d19493523d95e2dc 5b86abacd4b42434
```

لكي يكون التحويل قابلًا للتجزئة، يجب أن يكون قابلًا للتخليل بواسطة [dill](https://dill.readthedocs.io/en/latest/) أو [pickle](https://docs.python.org/3/library/pickle).

عندما تستخدم تحويلًا غير قابل للتجزئة، يستخدم 🤗 Datasets بصمة عشوائية بدلاً من ذلك ويرفع تحذيرًا. ويعتبر التحويل غير القابل للتجزئة مختلفًا عن التحويلات السابقة. ونتيجة لذلك، سيعيد 🤗 Datasets حساب جميع التحويلات. تأكد من أن تحويلاتك قابلة للتسلسل باستخدام pickle أو dill لتجنب ذلك!

مثال على عندما يعيد 🤗 Datasets حساب كل شيء هو عندما يتم تعطيل التخزين المؤقت. عندما يحدث هذا، يتم إنشاء ملفات ذاكرة التخزين المؤقت في كل مرة ويتم كتابتها في دليل مؤقت. بمجرد انتهاء جلسة Python الخاصة بك، يتم حذف ملفات ذاكرة التخزين المؤقت في الدليل المؤقت. يتم تعيين تجزئة عشوائية لملفات ذاكرة التخزين المؤقت هذه، بدلاً من بصمة.

<Tip>

عندما يكون التخزين المؤقت معطلاً، استخدم [`Dataset.save_to_disk`] لحفظ مجموعة البيانات المحولة الخاصة بك، وإلا فسيتم حذفها بمجرد انتهاء الجلسة.

</Tip>

## التجزئة

يتم تحديث بصمة مجموعة البيانات عن طريق تجزئة الدالة التي تم تمريرها إلى `map` وكذلك معلمات `map` (`batch_size`، `remove_columns`، وما إلى ذلك).

يمكنك التحقق من تجزئة أي كائن Python باستخدام [`fingerprint.Hasher`]:

```py
>>> from datasets.fingerprint import Hasher
>>> my_func = lambda example: {"length": len(example["text"])}
>>> print(Hasher.hash(my_func))
'3d35e2b3e94c81d6'
```

يتم حساب التجزئة عن طريق تفريغ الكائن باستخدام برنامج تفريغ `dill` وتجزئة البايتات المفروغة.

يقوم برنامج التفريغ بتفريغ جميع المتغيرات المستخدمة في دالتك بشكل متكرر، لذلك سيؤدي أي تغيير تجريه على كائن يتم استخدامه في دالتك إلى تغيير التجزئة.

إذا لم يكن لإحدى وظائفك نفس التجزئة عبر الجلسات، فهذا يعني أن أحد متغيراتها على الأقل يحتوي على كائن Python غير محدد.

عندما يحدث هذا، لا تتردد في تجزئة أي كائن تجده مشبوهًا لمحاولة العثور على الكائن الذي تسبب في تغيير التجزئة.

على سبيل المثال، إذا كنت تستخدم قائمة يكون ترتيب عناصرها غير محدد عبر الجلسات، فلن يكون التجزئة هو نفسه عبر الجلسات أيضًا.
Loading