1
0
Fork 0

Assembled from URLs hosted at https://huggingface.co/datasets/togethercomputer/RedPajama-Data-1T

Fourth batch of data

main
Zach Nation 1 year ago
parent e259594b2e
commit 2d0351412d
181 changed files (49 GiB → 176 GiB)
  1. 4
      book/book.jsonl
  2. 4
      common_crawl/2019-30/en_head_0014.json.gz.dedup.classifier.jsonl.zst
  3. 4
      common_crawl/2019-30/en_head_0023.json.gz.dedup.classifier.jsonl.zst
  4. 4
      common_crawl/2019-30/en_head_0025.json.gz.dedup.classifier.jsonl.zst
  5. 4
      common_crawl/2019-30/en_head_0032.json.gz.dedup.classifier.jsonl.zst
  6. 4
      common_crawl/2019-30/en_head_0039.json.gz.dedup.classifier.jsonl.zst
  7. 4
      common_crawl/2019-30/en_middle_0007.json.gz.dedup.classifier.jsonl.zst
  8. 4
      common_crawl/2019-30/en_middle_0013.json.gz.dedup.classifier.jsonl.zst
  9. 4
      common_crawl/2019-30/en_middle_0026.json.gz.dedup.classifier.jsonl.zst
  10. 4
      common_crawl/2019-30/en_middle_0036.json.gz.dedup.classifier.jsonl.zst
  11. 4
      common_crawl/2019-30/en_middle_0039.json.gz.dedup.classifier.jsonl.zst
  12. 4
      common_crawl/2019-30/en_middle_0057.json.gz.dedup.classifier.jsonl.zst
  13. 4
      common_crawl/2019-30/en_middle_0062.json.gz.dedup.classifier.jsonl.zst
  14. 4
      common_crawl/2019-30/en_middle_0074.json.gz.dedup.classifier.jsonl.zst
  15. 4
      common_crawl/2019-30/en_middle_0091.json.gz.dedup.classifier.jsonl.zst
  16. 4
      common_crawl/2020-05/en_head_0006.json.gz.dedup.classifier.jsonl.zst
  17. 4
      common_crawl/2020-05/en_head_0011.json.gz.dedup.classifier.jsonl.zst
  18. 4
      common_crawl/2020-05/en_head_0018.json.gz.dedup.classifier.jsonl.zst
  19. 4
      common_crawl/2020-05/en_head_0019.json.gz.dedup.classifier.jsonl.zst
  20. 4
      common_crawl/2020-05/en_head_0040.json.gz.dedup.classifier.jsonl.zst
  21. 4
      common_crawl/2020-05/en_head_0053.json.gz.dedup.classifier.jsonl.zst
  22. 4
      common_crawl/2020-05/en_head_0056.json.gz.dedup.classifier.jsonl.zst
  23. 4
      common_crawl/2020-05/en_head_0058.json.gz.dedup.classifier.jsonl.zst
  24. 4
      common_crawl/2020-05/en_head_0061.json.gz.dedup.classifier.jsonl.zst
  25. 4
      common_crawl/2020-05/en_head_0062.json.gz.dedup.classifier.jsonl.zst
  26. 4
      common_crawl/2020-05/en_head_0063.json.gz.dedup.classifier.jsonl.zst
  27. 4
      common_crawl/2020-05/en_head_0065.json.gz.dedup.classifier.jsonl.zst
  28. 4
      common_crawl/2020-05/en_middle_0015.json.gz.dedup.classifier.jsonl.zst
  29. 4
      common_crawl/2020-05/en_middle_0026.json.gz.dedup.classifier.jsonl.zst
  30. 4
      common_crawl/2020-05/en_middle_0029.json.gz.dedup.classifier.jsonl.zst
  31. 4
      common_crawl/2020-05/en_middle_0033.json.gz.dedup.classifier.jsonl.zst
  32. 4
      common_crawl/2020-05/en_middle_0096.json.gz.dedup.classifier.jsonl.zst
  33. 4
      common_crawl/2020-05/en_middle_0097.json.gz.dedup.classifier.jsonl.zst
  34. 4
      common_crawl/2020-05/en_middle_0099.json.gz.dedup.classifier.jsonl.zst
  35. 4
      common_crawl/2020-05/en_middle_0100.json.gz.dedup.classifier.jsonl.zst
  36. 4
      common_crawl/2020-05/en_middle_0101.json.gz.dedup.classifier.jsonl.zst
  37. 4
      common_crawl/2020-05/en_middle_0102.json.gz.dedup.classifier.jsonl.zst
  38. 4
      common_crawl/2020-05/en_middle_0103.json.gz.dedup.classifier.jsonl.zst
  39. 4
      common_crawl/2020-05/en_middle_0104.json.gz.dedup.classifier.jsonl.zst
  40. 4
      common_crawl/2020-05/en_middle_0106.json.gz.dedup.classifier.jsonl.zst
  41. 4
      common_crawl/2020-05/en_middle_0111.json.gz.dedup.classifier.jsonl.zst
  42. 4
      common_crawl/2020-05/en_middle_0113.json.gz.dedup.classifier.jsonl.zst
  43. 4
      common_crawl/2020-05/en_middle_0114.json.gz.dedup.classifier.jsonl.zst
  44. 4
      common_crawl/2020-05/en_middle_0120.json.gz.dedup.classifier.jsonl.zst
  45. 4
      common_crawl/2020-05/en_middle_0126.json.gz.dedup.classifier.jsonl.zst
  46. 4
      common_crawl/2021-04/en_head_0002.json.gz.dedup.classifier.jsonl.zst
  47. 4
      common_crawl/2021-04/en_head_0006.json.gz.dedup.classifier.jsonl.zst
  48. 4
      common_crawl/2021-04/en_head_0010.json.gz.dedup.classifier.jsonl.zst
  49. 4
      common_crawl/2021-04/en_head_0014.json.gz.dedup.classifier.jsonl.zst
  50. 4
      common_crawl/2021-04/en_head_0020.json.gz.dedup.classifier.jsonl.zst
  51. Some files were not shown because too many files have changed in this diff Show More
Loading…
Cancel
Save