Source code for timApp.tests.db.test_document

"""Unit tests for Document class.
"""

import random

from timApp.document.document import Document
from timApp.document.documentparser import DocumentParser
from timApp.document.documents import import_document_from_file
from timApp.document.documentwriter import DocumentWriter
from timApp.document.exceptions import DocExistsError
from timApp.document.randutils import random_paragraph
from timApp.document.viewcontext import default_view_ctx
from timApp.tests.db.timdbtest import TimDbTest
from timApp.timdb.exceptions import TimDbException
from timApp.user.usergroup import UserGroup
from timApp.util.utils import static_tim_doc


[docs]class DocumentTest(TimDbTest):
[docs]    def add_pars(self, d, num_docs):
        pars = [
            d.add_paragraph(random_paragraph()).get_id() for _ in range(0, num_docs)
        ]
        self.assertEqual((num_docs, 0), d.get_version())
        return pars

[docs]    def test_document_create(self):
        d = self.create_doc().document
        self.assertTrue(d.exists())
        self.assertEqual((0, 0), d.get_version())
        self.assertListEqual([], d.get_changelog().entries)

        d = self.create_doc().document
        self.assertTrue(d.exists())
        self.assertEqual((0, 0), d.get_version())
        self.assertListEqual([], d.get_changelog().entries)

        with self.assertRaises(DocExistsError):
            d.create()

[docs]    def test_addparagraph(self):
        d = self.create_doc().document

        # Add first paragraph
        par1 = d.add_paragraph("testing")
        self.assertEqual("testing", par1.get_markdown())
        self.assertTrue(d.has_paragraph(par1.get_id()))
        self.assertFalse(d.has_paragraph(par1.get_id()[:-1]))
        self.assertEqual((1, 0), d.get_version())
        self.assertEqual(1, len(d.get_changelog().entries))

        # Add different next paragraph
        par2 = d.add_paragraph("different")
        self.assertEqual("different", par2.get_markdown())
        self.assertTrue(d.has_paragraph(par2.get_id()))
        self.assertEqual((2, 0), d.get_version())
        self.assertEqual(2, len(d.get_changelog().entries))
        self.assertNotEqual(par1.get_id(), par2.get_id())

        # Add next paragraph with same text as the first
        par3 = d.add_paragraph("testing")
        self.assertEqual("testing", par3.get_markdown())
        self.assertTrue(d.has_paragraph(par3.get_id()))
        self.assertEqual((3, 0), d.get_version())
        self.assertEqual(3, len(d.get_changelog().entries))
        self.assertNotEqual(par1.get_id(), par2.get_id())

        # Add an empty paragraph
        par3 = d.add_paragraph("")
        self.assertEqual("", par3.get_markdown())
        self.assertTrue(d.has_paragraph(par3.get_id()))
        self.assertEqual((4, 0), d.get_version())
        self.assertEqual(4, len(d.get_changelog().entries))
        self.assertNotEqual(par2.get_id(), par3.get_id())
        self.assertNotEqual(par1.get_id(), par3.get_id())

[docs]    def test_iterator(self):
        d = self.create_doc().document

        pars = [d.add_paragraph(random_paragraph()) for _ in range(0, 10)]
        self.assertEqual((10, 0), d.get_version())
        self.assertEqual(10, len(d.get_changelog().entries))
        self.assertListEqual([p.get_id() for p in pars], [par.get_id() for par in d])
        self.assertListEqual(
            [p.get_hash() for p in pars], [par.get_hash() for par in d]
        )

[docs]    def test_delparagraph(self):
        d = self.create_doc().document
        pars = self.add_pars(d, 10)

        # Delete first paragraph
        d.delete_paragraph(pars[0])
        self.assertFalse(d.has_paragraph(pars[0]))
        with self.assertRaises(TimDbException):
            d.get_paragraph(pars[0])
        pars.remove(pars[0])
        self.assertListEqual(pars, [par.get_id() for par in d])
        self.assertEqual((11, 0), d.get_version())
        self.assertEqual(11, len(d.get_changelog().entries))

        # Delete from the middle
        d.delete_paragraph(pars[2])
        self.assertFalse(d.has_paragraph(pars[2]))
        with self.assertRaises(TimDbException):
            d.get_paragraph(pars[2])
        pars.remove(pars[2])
        self.assertListEqual(pars, [par.get_id() for par in d])
        self.assertEqual((12, 0), d.get_version())
        self.assertEqual(12, len(d.get_changelog().entries))

        # Delete last paragraph
        n = len(pars)
        d.delete_paragraph(pars[n - 1])
        self.assertFalse(d.has_paragraph(pars[n - 1]))
        with self.assertRaises(TimDbException):
            d.get_paragraph(pars[n - 1])
        pars.remove(pars[n - 1])
        self.assertListEqual(pars, [par.get_id() for par in d])
        self.assertEqual((13, 0), d.get_version())
        self.assertEqual(13, len(d.get_changelog().entries))

[docs]    def test_insertparagraph(self):
        d = self.create_doc().document
        pars = self.add_pars(d, 10)

        # Insert as first
        par = d.insert_paragraph("new first", insert_before_id=pars[0])
        pars = [par.get_id()] + pars
        self.assertListEqual(pars, [par.get_id() for par in d])
        self.assertEqual((11, 0), d.get_version())
        self.assertEqual(11, len(d.get_changelog().entries))

        # Insert in the middle
        par = d.insert_paragraph("middle", insert_before_id=pars[4])
        pars = pars[0:4] + [par.get_id()] + pars[4:]
        self.assertListEqual(pars, [par.get_id() for par in d])
        self.assertEqual((12, 0), d.get_version())
        self.assertEqual(12, len(d.get_changelog().entries))

        # Insert as last
        par = d.insert_paragraph("last", insert_before_id=None)
        pars.append(par.get_id())
        self.assertListEqual(pars, [par.get_id() for par in d])
        self.assertEqual((13, 0), d.get_version())
        self.assertEqual(13, len(d.get_changelog().entries))

[docs]    def test_get_html(self):
        d = self.create_doc().document

        par1 = d.add_paragraph("just text")
        self.assertEqual("<p>just text</p>", par1.get_html(default_view_ctx))

        par1 = d.add_paragraph("# Heading")
        self.assertEqual(
            '<h1 id="heading">Heading</h1>', par1.get_html(default_view_ctx)
        )

[docs]    def test_modify(self):
        d = self.create_doc().document
        pars = [d.add_paragraph(random_paragraph()) for _ in range(0, 10)]
        self.assertEqual((10, 0), d.get_version())

        par2_id = pars[2].get_id()
        par2_hash = pars[2].get_hash()
        old_md = pars[2].get_markdown()
        new_text = "new_text"
        par2_mod = d.modify_paragraph(par2_id, new_text)

        self.assertEqual(par2_id, par2_mod.get_id())
        self.assertEqual(new_text, d.get_paragraph(par2_id).get_markdown())
        self.assertEqual(new_text, par2_mod.get_markdown())
        self.assertNotEqual(par2_hash, par2_mod.get_hash())
        self.assertEqual((10, 1), d.get_version())
        self.assertEqual(11, len(d.get_changelog().entries))

        par2_mod = d.modify_paragraph(par2_id, old_md)
        self.assertEqual(old_md, par2_mod.get_markdown())
        self.assertEqual(old_md, d.get_paragraph(par2_id).get_markdown())

        for i in range(0, 10):
            par2_id = pars[i].get_id()
            par2_hash = pars[i].get_hash()
            new_text = random_paragraph()
            par2_mod = d.modify_paragraph(par2_id, new_text)
            self.assertEqual(par2_id, par2_mod.get_id())
            self.assertEqual(new_text, par2_mod.get_markdown())
            self.assertNotEqual(par2_hash, par2_mod.get_hash())
            self.assertEqual((10, i + 3), d.get_version())
            self.assertEqual(13 + i, len(d.get_changelog().entries))

[docs]    def test_update(self):
        random.seed(0)
        for i in range(1, 5):
            d = self.create_doc().document
            for _ in range(0, i):
                d.add_paragraph(random_paragraph())
            fulltext = d.export_markdown()
            d.update(fulltext, fulltext)
            self.assertEqual(fulltext, d.export_markdown())
            dp = DocumentParser(fulltext)
            blocks = dp.get_blocks()
            random.shuffle(blocks)
            blocks[0]["md"] = "modified"
            new_text = DocumentWriter(blocks).get_text()
            d.update(new_text, fulltext)
            blocks = DocumentParser(new_text).add_missing_attributes().get_blocks()
            self.assertListEqual(
                blocks,
                DocumentParser(d.export_markdown(export_hashes=True)).get_blocks(),
            )

[docs]    def test_update_section(self):
        random.seed(0)
        for i in range(6, 10):
            d = self.create_doc().document
            for _ in range(0, i):
                d.add_paragraph(random_paragraph())
            ids = [par.get_id() for par in d]
            new_pars = (
                DocumentParser("#-\none\n\n#-\ntwo\n\n#-\nthree")
                .add_missing_attributes()
                .get_blocks()
            )
            start_repl_index = 1
            end_repl_index = 4
            repl_length = len(new_pars)
            length_diff = repl_length - (end_repl_index - start_repl_index + 1)
            section_text = DocumentWriter(new_pars).get_text()
            d.update_section(section_text, ids[start_repl_index], ids[end_repl_index])
            new_ids = [par.get_id() for par in d]
            self.assertListEqual(
                [par["id"] for par in new_pars],
                new_ids[start_repl_index : start_repl_index + repl_length],
            )
            self.assertEqual(length_diff, len(new_ids) - len(ids))

[docs]    def test_macros(self):
        d = self.create_doc().document
        settings_par = d.add_paragraph(
            "```\n"
            'macro_delimiter: "%%"\n'
            "macros:\n"
            " testmacro: testvalue\n"
            ' year: "2015"\n'
            "```",
            attrs={"settings": ""},
        )
        macro_par = d.add_paragraph(
            "this is %%testmacro%% and year is %%year%% and user is %%username%% and %%nonexistent%%"
        )
        macro_par = d.get_paragraph(macro_par.get_id())  # Put the paragraph in cache
        self.assertEqual(
            {
                "macros": {"testmacro": "testvalue", "year": "2015"},
                "macro_delimiter": "%%",
            },
            d.get_settings().get_dict(),
        )

        # User-specific macros should be preserved
        self.assertEqual(
            "<p>this is testvalue and year is 2015 and user is %%username%% and</p>",
            macro_par.get_html(default_view_ctx),
        )
        d = Document(
            d.doc_id
        )  # Make a new instance of the document to test cache invalidation
        d.modify_paragraph(
            settings_par.get_id(),
            "```\n"
            'macro_delimiter: "%%"\n'
            "macros:\n"
            " testmacro: anothervalue\n"
            ' year: "2016"\n'
            "```",
            new_attrs={"settings": ""},
        )

        macro_par = d.get_paragraph(macro_par.get_id())
        self.assertEqual(
            "<p>this is anothervalue and year is 2016 and user is %%username%% and</p>",
            macro_par.get_html(default_view_ctx),
        )

[docs]    def test_macro_expansion_from_reference(self):
        d1 = self.create_doc().document
        d1.set_settings({"macros": {"first": "1", "second": "2"}})
        par1 = d1.add_paragraph("d1: %%first%% %%second%% %%third%%")
        d2 = self.create_doc().document
        d2.set_settings({"macros": {"first": "3", "second": "4", "third": "5"}})
        mi1 = d1.get_settings().get_macroinfo(default_view_ctx)
        mi2 = d2.get_settings().get_macroinfo(default_view_ctx)
        self.assertEqual("d1: 1 2 ", par1.get_expanded_markdown(mi1))
        ref_par1 = par1.create_reference(d2)
        d2.add_paragraph_obj(ref_par1)
        deref1 = ref_par1.get_referenced_pars()[0]
        self.assertEqual("d1: 1 2 ", deref1.get_expanded_markdown(mi1))
        par2 = d2.add_paragraph("d2: %%first%% %%second%% %%third%%")
        self.assertEqual("d2: 3 4 5", par2.get_expanded_markdown(mi2))
        ref_par2 = par2.create_reference(d1)
        d1.add_paragraph_obj(ref_par2)
        deref2 = ref_par2.get_referenced_pars()[0]
        self.assertEqual("d2: 3 4 5", deref2.get_expanded_markdown(mi2))

        self.assertEqual(
            "d1: 3 4 5",
            deref1.get_expanded_markdown(
                d2.get_settings().get_macroinfo(default_view_ctx)
            ),
        )
        self.assertEqual(
            "d1: 1 2 ",
            deref1.get_expanded_markdown(
                d1.get_settings().get_macroinfo(default_view_ctx)
            ),
        )
        self.assertEqual(
            "d2: 1 2 ",
            deref2.get_expanded_markdown(
                d1.get_settings().get_macroinfo(default_view_ctx)
            ),
        )
        self.assertEqual(
            "d2: 3 4 5",
            deref2.get_expanded_markdown(
                d2.get_settings().get_macroinfo(default_view_ctx)
            ),
        )

[docs]    def test_predefined_macros(self):
        d = self.create_doc().document
        p = d.add_paragraph("document id is %%docid%%")
        self.assertEqual(
            f"document id is {d.doc_id}",
            p.get_expanded_markdown(d.get_settings().get_macroinfo(default_view_ctx)),
        )

[docs]    def test_import(self):
        import_document_from_file(
            static_tim_doc("mmcq_example.md"),
            "Multiple choice plugin example",
            UserGroup.get_anonymous_group(),
        )

[docs]    def test_parwise_diff(self):
        d = self.create_doc().document
        num_pars = 10
        for i in range(0, num_pars):
            d.add_paragraph(f"Par {i}")
        pars = d.get_paragraphs()
        v = (num_pars, 0)
        self.assertEqual(v, d.get_version())
        for i in range(0, num_pars):
            d2 = d.get_doc_version((i, 0))
            self.assertListEqual(
                [
                    {
                        "type": "insert",
                        "after_id": pars[i - 1].get_id() if i > 0 else None,
                        "content": pars[i:],
                    }
                ],
                list(d2.parwise_diff(d)),
                msg=f"Diff test failed for i={i}",
            )
        ver_orig = d.get_doc_version()
        self.assertListEqual([], list(ver_orig.parwise_diff(d)))

        to_delete = num_pars // 2
        for i in range(0, 2):
            d.delete_paragraph(pars[to_delete + i].get_id())
            self.assertListEqual(
                [
                    {
                        "type": "delete",
                        "start_id": pars[to_delete].get_id(),
                        "end_id": pars[to_delete + i + 1].get_id(),
                    }
                ],
                list(ver_orig.parwise_diff(d)),
            )
        n1 = d.insert_paragraph("New 1", insert_before_id=pars[to_delete + 2].get_id())
        n2 = d.insert_paragraph("New 2", insert_before_id=pars[to_delete + 2].get_id())
        self.assertListEqual(
            [
                {
                    "type": "replace",
                    "start_id": pars[to_delete].get_id(),
                    "end_id": pars[to_delete + 2].get_id(),
                    "content": [n1, n2],
                }
            ],
            list(ver_orig.parwise_diff(d)),
        )
        new_ver = d.get_doc_version()
        n1 = d.modify_paragraph(n1.get_id(), "New edited 1")
        self.assertListEqual(
            [{"type": "change", "id": n1.get_id(), "content": [n1]}],
            list(new_ver.parwise_diff(d)),
        )

[docs]    def test_parwise_diff_html(self):
        d = self.create_doc().document
        num_pars = 10
        d.set_settings({"auto_number_headings": True})
        for i in range(0, num_pars):
            d.add_paragraph(f"# Header {i}")
        ver_orig = d.get_doc_version()
        pars = d.get_paragraphs()
        self.assertListEqual([], list(ver_orig.parwise_diff(d, default_view_ctx)))
        new = d.insert_paragraph("# Header new", insert_before_id=pars[1].get_id())
        self.assertListEqual(
            [{"type": "insert", "after_id": pars[0].get_id(), "content": [new]}],
            list(ver_orig.parwise_diff(d)),
        )

        # heading numbering changes should be detected
        self.assertListEqual(
            [{"type": "insert", "after_id": pars[0].get_id(), "content": [new]}]
            + [
                {"type": "change", "id": par.get_id(), "content": [par]}
                for par in pars[1:]
            ],
            list(ver_orig.parwise_diff(d, default_view_ctx)),
        )

[docs]    def test_clear_document(self):
        d = self.create_doc().document
        d.add_paragraph("test")
        d.update("", d.export_markdown())
        self.assertEqual("", d.export_markdown())

[docs]    def test_unsync_work(self):
        d = self.create_doc().document
        p = d.add_paragraph("test")
        old_hash = p.get_hash()
        p.set_markdown("test2")
        p.save()
        d.clear_mem_cache()
        pars = d.get_paragraphs()
        self.assertEqual("test2", pars[0].get_markdown())

        # Simulate the situation where the latest document version has incorrect version of the paragraph
        # So the hash line in paragraph list is different from where the 'current' symlink points
        path = d.get_version_path()
        with open(path, "w") as f:
            f.write(f"{p.get_id()}/{old_hash}")

        d.clear_mem_cache()
        pars = d.get_paragraphs()
        self.assertEqual("test", pars[0].get_markdown())

        p.set_markdown("test3")
        p.save()
        d.clear_mem_cache()
        pars = d.get_paragraphs()
        self.assertEqual("test3", pars[0].get_markdown())

[docs]    def test_settings_block_style(self):
        """Settings paragraph is always serialized in the block style."""
        d = self.create_doc().document
        d.set_settings({"a": 1})
        self.assertEqual(
            """
```
a: 1

```
""".strip(),
            d.get_paragraphs()[0].get_markdown(),
        )

[docs]    def test_settings_cached(self):
        d = self.create_doc().document
        d.set_settings({"x": 1})
        s1 = d.get_settings()
        self.assertEqual({"x": 1}, s1.get_dict())
        src1 = d.get_source_document()
        d.set_settings({"x": 2, "source_document": 10})
        s2 = d.get_settings()
        src2 = d.get_source_document()
        self.assertEqual({"x": 2, "source_document": 10}, s2.get_dict())
        self.assertIsNone(src1)
        self.assertEqual(10, src2.doc_id)
TIM documentation

Source code for timApp.tests.db.test_document