Add log and ckpt dir

Files changed (15) hide show

output/ckpt-9999/config.json ADDED Viewed

+{
+  "_name_or_path": ".",
+  "architectures": [
+    "T5ForConditionalGeneration"
+  ],
+  "d_ff": 3072,
+  "d_kv": 64,
+  "d_model": 768,
+  "decoder_start_token_id": 0,
+  "dropout_rate": 0.1,
+  "eos_token_id": 1,
+  "feed_forward_proj": "relu",
+  "gradient_checkpointing": false,
+  "initializer_factor": 1.0,
+  "is_encoder_decoder": true,
+  "layer_norm_epsilon": 1e-06,
+  "model_type": "t5",
+  "n_positions": 512,
+  "num_decoder_layers": 12,
+  "num_heads": 12,
+  "num_layers": 12,
+  "output_past": true,
+  "pad_token_id": 0,
+  "relative_attention_num_buckets": 32,
+  "task_specific_params": {
+    "summarization": {
+      "early_stopping": true,
+      "length_penalty": 2.0,
+      "max_length": 200,
+      "min_length": 30,
+      "no_repeat_ngram_size": 3,
+      "num_beams": 4,
+      "prefix": "summarize: "
+    },
+    "translation_en_to_de": {
+      "early_stopping": true,
+      "max_length": 300,
+      "num_beams": 4,
+      "prefix": "translate English to German: "
+    },
+    "translation_en_to_fr": {
+      "early_stopping": true,
+      "max_length": 300,
+      "num_beams": 4,
+      "prefix": "translate English to French: "
+    },
+    "translation_en_to_ro": {
+      "early_stopping": true,
+      "max_length": 300,
+      "num_beams": 4,
+      "prefix": "translate English to Romanian: "
+    }
+  },
+  "torch_dtype": "float32",
+  "transformers_version": "4.9.0.dev0",
+  "use_cache": true,
+  "vocab_size": 32103
+}

output/ckpt-9999/flax_model.msgpack ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:8299c056e5ca07f93db2db052d61cb941710e0925c62486ee0c9775116e0a6bf
+size 891548548

output/ckpt-9999/opt_state.msgpack ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:7c912197fd24feea06a22802e5bfbd9935100bb392a8d1966e230891aeaec658
+size 1783097336

output/ckpt-9999/training_state.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"step": 10000}

output/config.json ADDED Viewed

+{
+  "_name_or_path": ".",
+  "architectures": [
+    "T5ForConditionalGeneration"
+  ],
+  "d_ff": 3072,
+  "d_kv": 64,
+  "d_model": 768,
+  "decoder_start_token_id": 0,
+  "dropout_rate": 0.1,
+  "eos_token_id": 1,
+  "feed_forward_proj": "relu",
+  "gradient_checkpointing": false,
+  "initializer_factor": 1.0,
+  "is_encoder_decoder": true,
+  "layer_norm_epsilon": 1e-06,
+  "model_type": "t5",
+  "n_positions": 512,
+  "num_decoder_layers": 12,
+  "num_heads": 12,
+  "num_layers": 12,
+  "output_past": true,
+  "pad_token_id": 0,
+  "relative_attention_num_buckets": 32,
+  "task_specific_params": {
+    "summarization": {
+      "early_stopping": true,
+      "length_penalty": 2.0,
+      "max_length": 200,
+      "min_length": 30,
+      "no_repeat_ngram_size": 3,
+      "num_beams": 4,
+      "prefix": "summarize: "
+    },
+    "translation_en_to_de": {
+      "early_stopping": true,
+      "max_length": 300,
+      "num_beams": 4,
+      "prefix": "translate English to German: "
+    },
+    "translation_en_to_fr": {
+      "early_stopping": true,
+      "max_length": 300,
+      "num_beams": 4,
+      "prefix": "translate English to French: "
+    },
+    "translation_en_to_ro": {
+      "early_stopping": true,
+      "max_length": 300,
+      "num_beams": 4,
+      "prefix": "translate English to Romanian: "
+    }
+  },
+  "torch_dtype": "float32",
+  "transformers_version": "4.9.0.dev0",
+  "use_cache": true,
+  "vocab_size": 32103
+}

output/events.out.tfevents.1626477704.t1v-n-0e7426e8-w-0.83817.3.v2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:091b61fc500aae0368d977c5c0fd73632a32aabebdc0e7fba4129f26b6c8abdf
+size 6630102

output/events.out.tfevents.1626504033.t1v-n-0e7426e8-w-0.89661.3.v2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5b3b9f725bfa1e9befedd29c8c0319001a6ddc3597c6dfa30c754913531f26bc
+size 40

output/events.out.tfevents.1626504547.t1v-n-0e7426e8-w-0.93479.3.v2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:1d3bd0981ae5d2bb0ac2ffef88a1eac66f198c1a58e207b37e216a9997428160
+size 40

output/events.out.tfevents.1626505238.t1v-n-0e7426e8-w-0.95128.3.v2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:6b26b65cf4c438d4270d906ca1ed332fbe65f924ae82a22289dda08f95d5919f
+size 40

output/events.out.tfevents.1626506421.t1v-n-0e7426e8-w-0.96635.3.v2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:d1a031810dfc4c6e7c52913e5261afc3fa3d5cf5a68695b76bbffd177b065e27
+size 40

output/events.out.tfevents.1626507299.t1v-n-0e7426e8-w-0.98584.3.v2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:4874aada340bc85728ebb4b7f8329a0eb6618a19f0b646abb1f1b5f2e9fc84fe
+size 40

output/events.out.tfevents.1626508342.t1v-n-0e7426e8-w-0.101251.3.v2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:ed227170f48707b46db61d657803869c0be10d350b75f29b0844a6ef8a9e0cd3
+size 40

output/flax_model.msgpack ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:8299c056e5ca07f93db2db052d61cb941710e0925c62486ee0c9775116e0a6bf
+size 891548548

output/opt_state.msgpack ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:7c912197fd24feea06a22802e5bfbd9935100bb392a8d1966e230891aeaec658
+size 1783097336

output/training_state.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"step": 10000}